慧与科技(HPE)全新ProLiant服务器以英伟达Vera CPU为核心,标志着首个面向代理式AI的大型企业基础设施布局——英伟达称该市场规模达两千亿美元。
慧与科技(HPE)全新ProLiant服务器以英伟达Vera CPU为核心,标志着首个面向代理式AI的大型企业基础设施布局——英伟达称该市场规模达两千亿美元。

慧与科技(HPE)全新ProLiant服务器以英伟达Vera CPU为核心,标志着首个面向代理式AI的大型企业基础设施布局——英伟达称该市场规模达两千亿美元。
慧与科技周一发布了HPE ProLiant Compute DL394 Gen12服务器,这是一款搭载英伟达Vera CPU的2U服务器,两家公司表示该产品专为代理式AI工作负载设计。该服务器在台北国际电脑展上亮相,采用LPDDR5X内存,提供高达1.2 TB/s的聚合内存带宽——每核心高达14 GB/s——旨在解决制约CPU系统AI推理的内存瓶颈。
"从生成式模型到代理式系统的转变,正在重新定义企业计算的格局,"HPE总裁兼首席执行官安东尼奥·内里在一份声明中表示。"这些工作负载需要具备卓越CPU性能的高性能服务器,以便在代理式AI和金融服务应用中实现实时推理。"
Vera CPU采用单片设计,而非x86处理器常见的高核心数芯粒架构,后者存在非统一内存访问问题,会导致延迟变化。通过直接集成LPDDR5X内存,该系统实现了确定性性能——这对于微秒级延迟都会带来实际成本的金融服务来说至关重要。纽约证券交易所每天处理超过1.1万亿条消息,目前正与HPE、英伟达以及数据流公司Redpanda合作探索该平台。
"代理式AI已经到来,它需要一款全新的CPU,"英伟达创始人兼首席执行官黄仁勋表示。"Vera旨在编排AI工厂——与x86相比,效率提升两倍,任务完成速度更快。"
Vera架构对AI工作负载的意义
英伟达的Vera CPU标志着公司从传统的以GPU为中心的战略转型。与依赖通过互连连接多个芯片的芯粒设计的x86服务器芯片不同,Vera采用单一单片芯片,并集成LPDDR5X内存控制器。这消除了NUMA相关的延迟变化,当AI代理必须实时推理和响应时,这一点变得至关重要。
根据已公布的规格,1.2 TB/s的内存带宽相比,英特尔和超威半导体当前一代x86服务器处理器的带宽约为500-700 GB/s。对于代理式AI工作负载——模型必须检索上下文、跨多个数据源进行推理并按顺序生成响应——内存带宽往往比原始计算时钟速度更能决定吞吐量。
HPE表示,该服务器将于2026年秋季上市,作为其Nvidia AI Computing by HPE产品组合的一部分。该公司还通过其90/9 Advantage计划提供融资,该计划允许在90天内延迟付款,随后九个月按1%利率支付。
安全与管理成为竞争差异化优势
HPE表示,DL394 Gen12是首款符合NIST抗量子计算安全要求的HPE服务器。它通过HPE的Silicon Root of Trust在固件层面嵌入安全性,并利用其Integrated Lights-Out 7管理控制器中的安全区域来保护服务器整个生命周期的安全。
HPE表示,HPE Compute Ops Management提供了一个统一仪表板,用于管理分布式服务器环境,通过AI驱动的运营减少管理时间并最大限度地降低停机的收入损失。
竞争 stakes 极高。英伟达的Vera CPU为公司与英特尔和AMD的竞争开辟了新战线,后两者主导着两千亿美元的服务器CPU市场。如果Vera能够实现黄仁勋所声称的两倍效率提升,那么它可能会削弱x86在企业数据中心的主导地位——尤其是在延迟和内存带宽比原始核心数量更重要的AI推理领域。
HPE股价周一盘前交易上涨1.8%。过去一年涨幅超过80%的英伟达股价基本持平。该服务器将于2026年秋季上市,这意味着任何收入贡献至少还需两个季度才能实现,但纽交所试点项目提供了一个标志性的参考客户,可能加速企业采用。
本文仅供参考,不构成投资建议。