英伟达首款专为AI智能体设计的CPU已进入生产阶段,任务完成速度比x86处理器快1.8倍,对英特尔和AMD的服务器霸主地位构成威胁。
英伟达首款专为AI智能体设计的CPU已进入生产阶段,任务完成速度比x86处理器快1.8倍,对英特尔和AMD的服务器霸主地位构成威胁。

英伟达首款专为AI智能体设计的CPU已进入生产阶段,任务完成速度比x86处理器快1.8倍,对英特尔和AMD的服务器霸主地位构成威胁。
英伟达Vera CPU是该公司首款专为智能体AI工作负载打造的处理器,其任务完成速度比x86竞品快1.8倍,在AI工厂规模化扩张之际,挑战了英特尔和AMD在数据中心计算领域长达数十年的主导地位。
"AI智能体将成为计算的最大用户,"英伟达创始人兼首席执行官黄仁勋表示。"Vera是首款为这一未来设计的CPU——专为在超大规模下以卓越性能、效率和可编程性运行智能体AI而生。"
Vera搭载88个定制Olympus核心,采用空间多线程技术及LPDDR5X内存子系统,提供1.2TB/s带宽。它是英伟达Grace CPU的继任者,后者已出货近250万颗。Phoronix基准测试显示,Vera在智能体工作负载(包括代码编译、Python、Java及数据库处理)方面全面领先。该芯片通过第二代NVLink-C2C互连(提供1.8TB/s一致性带宽)充当Vera Rubin NVL72系统的宿主CPU,同时为AI存储平台驱动Vera BlueField-4 STX处理器。
此次发布标志着英伟达对英特尔和AMD服务器CPU业务最直接的进攻,该市场规模约为每年300亿美元。来自戴尔科技、慧与、联想和超微的Vera系统将于今年秋季开始供货,CoreWeave、甲骨文云基础设施和Lambda等将成为首批采用的云服务商。
Vera架构瞄准智能体AI瓶颈
AI工厂的经济逻辑正从每核心成本转向每Token成本,需要更快完成编排和数据处理的CPU。Vera的Olympus核心专为Python运行时、沙盒代码执行和分析管道而设计——这些正是让GPU闲置的CPU密集型步骤。其空间多线程技术能够预判应用程序行为,在大量并发环境中移动数据,从而降低多步骤智能体工作流中的延迟——一个提示词即可触发长达数千步的推理过程。
Vera CPU可部署于整个AI工厂——从独立的CPU基础设施到紧密耦合的加速系统。它扩展了英伟达在机架规模的机密计算能力,通过高速互连对数据进行加密,并配合硬件级认证,确保专有模型和受监管数据获得防篡改执行。
广泛部署对现有厂商构成压力
英伟达已获得广泛支持。正在评估或部署Vera的客户包括纽交所、Anthropic、OpenAI、SpaceX AI、字节跳动、CoreWeave、Lambda、Nebius、Nscale和甲骨文云基础设施。提供Vera系统的服务器厂商涵盖Aivres、华擎Rack、华硕、Compal、戴尔、富士康、技嘉、慧与、Inventec、联想、MiTAC Computing、微星、和硕、云达科技、超微、纬创和纬颖——共计18家制造商。
Vera Rubin平台将Vera CPU与Rubin GPU配对,与前代Grace Blackwell平台相比,智能体吞吐量提升10倍。该平台还引入了采用共封装光学的Spectrum-X以太网光子技术,支持百万GPU级AI工厂,能效比传统收发器提升5倍。英伟达的供应链覆盖台湾地区150家合作伙伴,遍布30个国家的350家工厂。
对投资者而言,问题在于Vera能否在服务器CPU市场占据可观份额。英伟达股价目前约为远期市盈率35倍。英特尔和AMD在服务器CPU领域已主导数十年,但智能体AI工作负载的转变催生了新的架构需求,这对专用芯片有利。量产出货将于今年秋季启动。
本文仅供参考,不构成投资建议。