Baseten的150亿美元融资表明,企业AI支出正从昂贵的封闭模型转向更便宜的开源替代方案。
Baseten的150亿美元融资表明,企业AI支出正从昂贵的封闭模型转向更便宜的开源替代方案。

Baseten的150亿美元融资表明,企业AI支出正从昂贵的封闭模型转向更便宜的开源替代方案。
Baseten是一家为开源模型构建推理基础设施的AI初创公司,即将完成一轮150亿美元的融资,估值高达130亿美元。这是资本市场最新的一笔押注,认为企业会将AI支出从昂贵的封闭模型转向更便宜的替代方案。
"开源模型正变得非常、非常强大,"Baseten联合创始人兼首席执行官Tuhin Srivastava表示。"随着开源模型变得更好,我们也在随之成长。"
据该公司透露,本轮融资采用双层结构,部分投资者按110亿美元估值参与,另一部分按130亿美元估值进入。Altimeter Capital、Conviction、Spark Capital、Sands Capital和Wellington Management共同领投——这也是Wellington首次涉足AI推理领域。Baseten的软件层构建在来自20家云服务商的计算能力之上,为客户提供运行、优化和训练开源模型的基础设施,而无需自行管理硬件。
这一押注反映了一个更广泛的市场转变。根据独立测试,开源模型与封闭模型之间的质量差距已从2023年的两年缩短至如今在关键工程基准上的仅数周时间。DeepSeek-V4是一个拥有1.6万亿参数的开源模型,每百万输出标记的成本约为87美分——大约是OpenAI和Anthropic前沿模型定价的三十分之一。如果企业将其AI支出的哪怕一小部分转向开源替代方案,支撑超过2000亿美元数据中心建设热潮的收入预期将面临严重压力。
推理层成为一门生意
Baseten是受益于推理热潮的不断壮大的初创公司生态的一部分——推理是AI模型利用计算能力响应用户查询的过程。专为推理设计芯片的Cerebras已于5月上市,目前市值接近500亿美元。Fireworks AI在10月以40亿美元估值完成融资,而构建自主编程代理的初创公司Factory在4月估值达到15亿美元。
经济账正在推动采用。一位Baseten客户告诉Srivastava,它在执行某项特定任务时,成本仅为使用封闭模型的30%。Baseten的大多数客户混合使用开源和封闭模型,仅在需要绝对最佳性能的任务中使用前沿系统,而将常规工作负载路由至更便宜的替代方案。
"开源模型总是比前沿模型落后几个月,但它们可以服务大量用例,同时为绝对最佳的任务节省部分代币使用量,"Wellington Management的投资人Oz Nur表示。
中国的开源攻势
目前最流行的开源模型来自中国的实验室。DeepSeek的V4系列和Z.ai的GLM-5.2在工程任务上的基准测试得分已可与领先的美国模型媲美甚至超越。GLM-5.2在Terminal-Bench 2.1上获得了81.0分,高于数周前发布的前一版本的62分。它拥有100万标记的上下文窗口,每标记成本约为美国领先封闭模型的六分之一。
美国公司正在努力追赶。Nvidia最近推出了开源模型系列Nemotron,而Meta继续开发其Llama系列。但中国实验室的迭代速度更快——GLM在四个月内从5.0版推进到5.2版,且每次发布均基于国产芯片训练。
投资者的算盘
对投资者而言,这笔账很简单。GPT-4级别输出的成本已从2022年末的每百万标记约20美元降至如今的约40美分——下降了近千倍。这种通缩因今年内存短缺而暂停,但即将上线的新晶圆厂产能可能会恢复这一趋势。与此同时,Nvidia售价4700美元、配备128GB统一内存的桌面级DGX Spark,现已能在本地运行多达2000亿参数的模型。
如果前沿级别的开源模型可在价格合理的本地硬件上运行,那么支撑数据中心GPU五年折旧周期的集中式推理需求可能会低于预期增长。Michael Burry已指出,整个行业到2028年约有1760亿美元的折旧被低估,美国计划于2026年建设的数据中心项目中,已有约一半面临延期或取消。
Baseten的客户包括Cursor、Mercor和OpenEvidence。《The Information》此前报道了本轮融资。
本文仅供参考,不构成投资建议。