HPE推出Vera驱动服务器，瞄准两千亿美元代理式AI市场

慧与科技（HPE）全新ProLiant服务器以英伟达Vera CPU为核心，标志着首个面向代理式AI的大型企业基础设施布局——英伟达称该市场规模达两千亿美元。

慧与科技周一发布了HPE ProLiant Compute DL394 Gen12服务器，这是一款搭载英伟达Vera CPU的2U服务器，两家公司表示该产品专为代理式AI工作负载设计。该服务器在台北国际电脑展上亮相，采用LPDDR5X内存，提供高达1.2 TB/s的聚合内存带宽——每核心高达14 GB/s——旨在解决制约CPU系统AI推理的内存瓶颈。

"从生成式模型到代理式系统的转变，正在重新定义企业计算的格局，"HPE总裁兼首席执行官安东尼奥·内里在一份声明中表示。"这些工作负载需要具备卓越CPU性能的高性能服务器，以便在代理式AI和金融服务应用中实现实时推理。"

Vera CPU采用单片设计，而非x86处理器常见的高核心数芯粒架构，后者存在非统一内存访问问题，会导致延迟变化。通过直接集成LPDDR5X内存，该系统实现了确定性性能——这对于微秒级延迟都会带来实际成本的金融服务来说至关重要。纽约证券交易所每天处理超过1.1万亿条消息，目前正与HPE、英伟达以及数据流公司Redpanda合作探索该平台。

"代理式AI已经到来，它需要一款全新的CPU，"英伟达创始人兼首席执行官黄仁勋表示。"Vera旨在编排AI工厂——与x86相比，效率提升两倍，任务完成速度更快。"

Vera架构对AI工作负载的意义

英伟达的Vera CPU标志着公司从传统的以GPU为中心的战略转型。与依赖通过互连连接多个芯片的芯粒设计的x86服务器芯片不同，Vera采用单一单片芯片，并集成LPDDR5X内存控制器。这消除了NUMA相关的延迟变化，当AI代理必须实时推理和响应时，这一点变得至关重要。

根据已公布的规格，1.2 TB/s的内存带宽相比，英特尔和超威半导体当前一代x86服务器处理器的带宽约为500-700 GB/s。对于代理式AI工作负载——模型必须检索上下文、跨多个数据源进行推理并按顺序生成响应——内存带宽往往比原始计算时钟速度更能决定吞吐量。

HPE表示，该服务器将于2026年秋季上市，作为其Nvidia AI Computing by HPE产品组合的一部分。该公司还通过其90/9 Advantage计划提供融资，该计划允许在90天内延迟付款，随后九个月按1%利率支付。

安全与管理成为竞争差异化优势

HPE表示，DL394 Gen12是首款符合NIST抗量子计算安全要求的HPE服务器。它通过HPE的Silicon Root of Trust在固件层面嵌入安全性，并利用其Integrated Lights-Out 7管理控制器中的安全区域来保护服务器整个生命周期的安全。

HPE表示，HPE Compute Ops Management提供了一个统一仪表板，用于管理分布式服务器环境，通过AI驱动的运营减少管理时间并最大限度地降低停机的收入损失。

竞争 stakes 极高。英伟达的Vera CPU为公司与英特尔和AMD的竞争开辟了新战线，后两者主导着两千亿美元的服务器CPU市场。如果Vera能够实现黄仁勋所声称的两倍效率提升，那么它可能会削弱x86在企业数据中心的主导地位——尤其是在延迟和内存带宽比原始核心数量更重要的AI推理领域。

HPE股价周一盘前交易上涨1.8%。过去一年涨幅超过80%的英伟达股价基本持平。该服务器将于2026年秋季上市，这意味着任何收入贡献至少还需两个季度才能实现，但纽交所试点项目提供了一个标志性的参考客户，可能加速企业采用。

本文仅供参考，不构成投资建议。