Nvidia Vera CPU挑战x86架构，智能体AI任务完成速度提升1.8倍

英伟达首款专为AI智能体设计的CPU已进入生产阶段，任务完成速度比x86处理器快1.8倍，对英特尔和AMD的服务器霸主地位构成威胁。

英伟达Vera CPU是该公司首款专为智能体AI工作负载打造的处理器，其任务完成速度比x86竞品快1.8倍，在AI工厂规模化扩张之际，挑战了英特尔和AMD在数据中心计算领域长达数十年的主导地位。

"AI智能体将成为计算的最大用户，"英伟达创始人兼首席执行官黄仁勋表示。"Vera是首款为这一未来设计的CPU——专为在超大规模下以卓越性能、效率和可编程性运行智能体AI而生。"

Vera搭载88个定制Olympus核心，采用空间多线程技术及LPDDR5X内存子系统，提供1.2TB/s带宽。它是英伟达Grace CPU的继任者，后者已出货近250万颗。Phoronix基准测试显示，Vera在智能体工作负载（包括代码编译、Python、Java及数据库处理）方面全面领先。该芯片通过第二代NVLink-C2C互连（提供1.8TB/s一致性带宽）充当Vera Rubin NVL72系统的宿主CPU，同时为AI存储平台驱动Vera BlueField-4 STX处理器。

此次发布标志着英伟达对英特尔和AMD服务器CPU业务最直接的进攻，该市场规模约为每年300亿美元。来自戴尔科技、慧与、联想和超微的Vera系统将于今年秋季开始供货，CoreWeave、甲骨文云基础设施和Lambda等将成为首批采用的云服务商。

Vera架构瞄准智能体AI瓶颈

AI工厂的经济逻辑正从每核心成本转向每Token成本，需要更快完成编排和数据处理的CPU。Vera的Olympus核心专为Python运行时、沙盒代码执行和分析管道而设计——这些正是让GPU闲置的CPU密集型步骤。其空间多线程技术能够预判应用程序行为，在大量并发环境中移动数据，从而降低多步骤智能体工作流中的延迟——一个提示词即可触发长达数千步的推理过程。

Vera CPU可部署于整个AI工厂——从独立的CPU基础设施到紧密耦合的加速系统。它扩展了英伟达在机架规模的机密计算能力，通过高速互连对数据进行加密，并配合硬件级认证，确保专有模型和受监管数据获得防篡改执行。

广泛部署对现有厂商构成压力

英伟达已获得广泛支持。正在评估或部署Vera的客户包括纽交所、Anthropic、OpenAI、SpaceX AI、字节跳动、CoreWeave、Lambda、Nebius、Nscale和甲骨文云基础设施。提供Vera系统的服务器厂商涵盖Aivres、华擎Rack、华硕、Compal、戴尔、富士康、技嘉、慧与、Inventec、联想、MiTAC Computing、微星、和硕、云达科技、超微、纬创和纬颖——共计18家制造商。

Vera Rubin平台将Vera CPU与Rubin GPU配对，与前代Grace Blackwell平台相比，智能体吞吐量提升10倍。该平台还引入了采用共封装光学的Spectrum-X以太网光子技术，支持百万GPU级AI工厂，能效比传统收发器提升5倍。英伟达的供应链覆盖台湾地区150家合作伙伴，遍布30个国家的350家工厂。

对投资者而言，问题在于Vera能否在服务器CPU市场占据可观份额。英伟达股价目前约为远期市盈率35倍。英特尔和AMD在服务器CPU领域已主导数十年，但智能体AI工作负载的转变催生了新的架构需求，这对专用芯片有利。量产出货将于今年秋季启动。

本文仅供参考，不构成投资建议。