Baseten融资150亿美元，押注更便宜的开源AI模型

Baseten的150亿美元融资表明，企业AI支出正从昂贵的封闭模型转向更便宜的开源替代方案。

Baseten是一家为开源模型构建推理基础设施的AI初创公司，即将完成一轮150亿美元的融资，估值高达130亿美元。这是资本市场最新的一笔押注，认为企业会将AI支出从昂贵的封闭模型转向更便宜的替代方案。

"开源模型正变得非常、非常强大，"Baseten联合创始人兼首席执行官Tuhin Srivastava表示。"随着开源模型变得更好，我们也在随之成长。"

据该公司透露，本轮融资采用双层结构，部分投资者按110亿美元估值参与，另一部分按130亿美元估值进入。Altimeter Capital、Conviction、Spark Capital、Sands Capital和Wellington Management共同领投——这也是Wellington首次涉足AI推理领域。Baseten的软件层构建在来自20家云服务商的计算能力之上，为客户提供运行、优化和训练开源模型的基础设施，而无需自行管理硬件。

这一押注反映了一个更广泛的市场转变。根据独立测试，开源模型与封闭模型之间的质量差距已从2023年的两年缩短至如今在关键工程基准上的仅数周时间。DeepSeek-V4是一个拥有1.6万亿参数的开源模型，每百万输出标记的成本约为87美分——大约是OpenAI和Anthropic前沿模型定价的三十分之一。如果企业将其AI支出的哪怕一小部分转向开源替代方案，支撑超过2000亿美元数据中心建设热潮的收入预期将面临严重压力。

推理层成为一门生意

Baseten是受益于推理热潮的不断壮大的初创公司生态的一部分——推理是AI模型利用计算能力响应用户查询的过程。专为推理设计芯片的Cerebras已于5月上市，目前市值接近500亿美元。Fireworks AI在10月以40亿美元估值完成融资，而构建自主编程代理的初创公司Factory在4月估值达到15亿美元。

经济账正在推动采用。一位Baseten客户告诉Srivastava，它在执行某项特定任务时，成本仅为使用封闭模型的30%。Baseten的大多数客户混合使用开源和封闭模型，仅在需要绝对最佳性能的任务中使用前沿系统，而将常规工作负载路由至更便宜的替代方案。

"开源模型总是比前沿模型落后几个月，但它们可以服务大量用例，同时为绝对最佳的任务节省部分代币使用量，"Wellington Management的投资人Oz Nur表示。

中国的开源攻势

目前最流行的开源模型来自中国的实验室。DeepSeek的V4系列和Z.ai的GLM-5.2在工程任务上的基准测试得分已可与领先的美国模型媲美甚至超越。GLM-5.2在Terminal-Bench 2.1上获得了81.0分，高于数周前发布的前一版本的62分。它拥有100万标记的上下文窗口，每标记成本约为美国领先封闭模型的六分之一。

美国公司正在努力追赶。Nvidia最近推出了开源模型系列Nemotron，而Meta继续开发其Llama系列。但中国实验室的迭代速度更快——GLM在四个月内从5.0版推进到5.2版，且每次发布均基于国产芯片训练。

投资者的算盘

对投资者而言，这笔账很简单。GPT-4级别输出的成本已从2022年末的每百万标记约20美元降至如今的约40美分——下降了近千倍。这种通缩因今年内存短缺而暂停，但即将上线的新晶圆厂产能可能会恢复这一趋势。与此同时，Nvidia售价4700美元、配备128GB统一内存的桌面级DGX Spark，现已能在本地运行多达2000亿参数的模型。

如果前沿级别的开源模型可在价格合理的本地硬件上运行，那么支撑数据中心GPU五年折旧周期的集中式推理需求可能会低于预期增长。Michael Burry已指出，整个行业到2028年约有1760亿美元的折旧被低估，美国计划于2026年建设的数据中心项目中，已有约一半面临延期或取消。

Baseten的客户包括Cursor、Mercor和OpenEvidence。《The Information》此前报道了本轮融资。

本文仅供参考，不构成投资建议。