OpenAI推理成本削减50%，发动价格战压制竞争对手

OpenAI将推理成本削减一半，为其在准备1200亿美元融资的同时压低竞争对手价格提供了空间。

OpenAI工程师将部分现有模型的推理成本降低了50%以上，使该公司能够以Anthropic竞品Claude Fable 5一半的价格为其旗舰产品GPT-5.6 Sol定价，同时在基准测试中表现更优。

据The Information报道，该公司将该方法视为"秘方"，并实施了严格的内部访问控制。记者Steph Palazzolo表示："他们甚至不愿告诉其他OpenAI员工，因为一旦泄露，其他实验室可能采用并同样降低其成本。"

Sol在Terminal-Bench 2.1基准测试中得分高于Anthropic的Claude Mythos 5，但成本比Claude Fable 5低50%。这一效率提升还使OpenAI能够仅用几百块英伟达GPU运行未登录用户的ChatGPT流量，仅为服务于数亿月活用户的典型算力需求的一小部分。

这一成本优势出现之际，OpenAI正接近完成一轮1200亿美元融资，投前估值为7300亿美元，首席执行官萨姆·奥尔特曼正力争在Anthropic之前实现首次公开募股。利润率改善为该估值叙事提供了关键的财务支撑——这一估值取决于持续盈利能力提升。

转向企业市场

推理突破为OpenAI更广泛的战略转型提供了支撑。应用业务负责人菲吉·西莫在最近的全员会议上告诉员工，公司将降低视频生成器Sora等消费产品的优先级——该产品已被关停以重新调配计算资源——转而专注于利润率更高的企业工具和编码产品。此举反映出一种认识：消费级AI产品面临微薄利润和来自免费替代品的激烈竞争，而企业客户则为可靠性、安全性和定制化支付溢价。

OpenAI对编码工具的专注具有特别的战略意义。软件开发是AI最大的可寻址市场之一，GitHub Copilot及类似工具年收入已达数十亿美元。通过将更低的推理成本与更优的编码性能相结合，OpenAI可以在保持质量的同时在价格上压过GitHub Copilot和亚马逊CodeWhisperer等竞争对手。

基础设施自主化

成本削减也与OpenAI加强基础设施自主掌控的努力相一致。该公司近期与博通合作开发定制推理芯片，此举可能减少对英伟达GPU的依赖。英伟达最近一个财年数据中心收入达620亿美元，主要来自运行在H100和B200处理器上的AI推理工作负载。定制芯片每年可为OpenAI节省数十亿美元的GPU采购成本，进一步扩大其对依赖第三方硬件竞争对手的利润率优势。

效率提升可能来自多种技术，包括量化——降低模型权重的精度以加速计算——以及缓存优化，即存储常用结果。这些方法在业内广为人知，但OpenAI能够实现50%的降幅表明其拥有竞争对手尚未企及的专有改进。

对投资者而言，关键在于OpenAI的成本优势能否持久。如果Anthropic、Google DeepMind或Meta等竞争对手复制了该方法，定价优势可能迅速消失。OpenAI股票尚未公开交易，但该公司在私募市场7300亿美元的估值意味着投资者已将持续的利润率改善纳入定价——这意味着该优势的任何侵蚀都将对IPO叙事构成风险。该公司与博通的合作以及对成本削减方法的内部保密表明，OpenAI正押注其在推理效率上的领先地位足以在竞争对手追赶之前巩固市场份额。

本文仅供信息参考，不构成投资建议。