要点:
- IREN与BE Networks合作,在部署前模拟超过5万块Blackwell Ultra GPU
- NVIDIA DSX Air创建数字孪生,验证网络架构并降低集成风险
- 该方法将验证周期从数月压缩至数周,加速AI工厂交付
要点:

在安装任何一个机架之前就对5万块GPU集群进行模拟,这标志着AI基础设施建设方式的转变——也标志着谁能参与其中。
IREN Ltd.正与BE Networks合作,利用NVIDIA的DSX Air仿真平台,为其即将部署的超过5万块NVIDIA Blackwell Ultra GPU验证网络架构。两家公司周一表示,该计划在物理基础设施部署之前,创建了一个具有生产代表性的IREN AI云环境数字孪生,使双方能够对集群行为进行建模、验证网络拓扑并测试自动化工作流程——这正成为大规模AI部署中的瓶颈。
"这种规模的AI云基础设施需要极高的精确度,"IREN首席技术官Denis Skrinnikoff表示。"通过将NVIDIA DSX Air与BE Networks的自动化专业知识相结合,我们可以在部署前验证关键设计和运营决策,降低集成风险,并以更高的信心为客户上线算力。"
该仿真环境覆盖了NVIDIA完整的AI工厂技术栈——Blackwell Ultra计算、Spectrum-X以太网 Fabric和NVLink扩展网络——以及存储、编排和安全层。BE Networks将以其Verity自动化平台支持此次部署,将经过验证的设计转化为可重复的工作流程,覆盖Day 0设计、Day 1启用和Day 2运营阶段。据NVIDIA网络高级副总裁Gilad Shainer称,该方法旨在将验证时间线从数月压缩至数周。
"AI工厂是有史以来最复杂的系统之一,模拟对于高速和大规模部署它们正变得不可或缺,"Shainer表示。
DSX平台在生态系统中扩展
此次部署正值NVIDIA扩展其DSX平台之际。该平台于5月31日在GTC台北大会上发布,将开源软件库、参考设计和合作伙伴技术整合为一个用于AI工厂设计和运营的统一框架。CoreWeave、Crusoe、Firmus、Lambda、Nebius、Nscale和Yotta Data Services等云合作伙伴已经在部署DSX组件——DSX Sim、DSX MaxLPS和DSX OS——以降低风险并提高GPU利用率。
在硬件方面,戴尔科技、慧与、联想和Supermicro正在与台湾制造商华硕、富士康、技嘉、和硕、广达云端技术、纬创和纬颖一起构建DSX就绪系统。系统集成商广达云端技术和和硕正在与达索系统合作,创建一个实时AI工厂数字孪生配置器,以实现从机架到设施设计的自动化。
模拟对AI基础设施竞赛的意义
对于IREN而言,在AI云提供商面临更快上线算力同时保持可靠性的压力之下,先模拟后建设的能力降低了集成风险。该公司采用垂直整合模式——在北美、欧洲和亚太地区的可再生能源丰富地区同时拥有数据中心基础设施和GPU集群——这使其能够在AI训练和推理工作负载方面与大型超大规模云提供商竞争。
这种方法还降低了小型云提供商以超大规模复杂度进行部署的门槛。通过在虚拟环境中验证网络设计,企业可以避免物理部署期间的昂贵返工——这一风险已导致整个行业的AI工厂项目延误。NVIDIA的Shainer表示,DSX使组织能够在数周内而不是数月内验证基础设施设计,并在数天内而不是数周内部署软件。
对投资者而言,这一合作表明AI基础设施的建设仍处于积极扩张的轨道上。IREN的5万块GPU集群如果成功部署,将成为规模最大的单站点AI超级计算机之一,与CoreWeave和Lambda运营的集群展开竞争。该公司未披露此次部署的总资本支出,也未说明该集群何时上线。
本文仅供参考,不构成投资建议。