Z.ai 开源 GLM-5.2，编程能力超越 GPT-5.5，API 成本仅为其六分之一

Z.ai 的 GLM-5.2 在关键编程基准测试上以极低的成本媲美甚至超越 OpenAI 的 GPT-5.5 和 Anthropic 的 Claude Opus 4.8，而其 MIT 开源许可证允许企业绕过地域限制。

Z.ai 发布了 GLM-5.2，一款 7530 亿参数的开源权重模型，在多个长周期编程基准测试上击败 GPT-5.5，同时 API 价格仅为其六分之一，加剧了前沿 AI 市场的竞争。

"GLM-5.2 是首个在 Terminal-Bench 上突破 80% 分数大关的开源权重模型，并且击败了所有其他可用开源模型，"Cline IDE 背后的团队在 X 平台上表示，并宣布该模型已首日集成至其开源编程环境中。

该模型在 SWE-bench Pro 上得分 62.1，超越 GPT-5.5 的 58.6 分及其前代 GLM-5.1 的 58.4 分。在测试长周期任务完成能力的 FrontierSWE 上，其得分达到 74.4%，仅落后 Claude Opus 4.8 的 75.1% 不到一个百分点。其 100 万 token 的上下文窗口——较 GLM-5.1 的 20 万 token 大幅扩展——由全新的 IndexShare 架构驱动，该架构在每四个稀疏注意力层之间共享同一个索引器，在最大上下文长度下将每个 token 的计算 FLOPs 降低了 2.9 倍。

API 定价为每百万输入 token 1.40 美元、每百万输出 token 4.40 美元，相比之下 GPT-5.5 分别为 5.00 美元和 30.00 美元。MIT 开源许可证允许企业本地部署该模型，消除了供应商锁定问题，并可绕过近期美国出口管制指令导致 Anthropic 的 Claude Fable 5 限制境外访问的地域限制。

在 Design Arena 众包基准测试中，GLM-5.2 以 1,360 的 ELO 评分夺得第一，甚至击败了 Claude Fable 5。在 Code Arena（一个由全球数百万用户进行盲测的前端开发评估系统）中，该模型在所有可用模型中排名第一。该模型还引入了可选的"思维模式"——"Max"模式使用约 8.5 万输出 token 每任务来推动最高智能水平，而"High"模式则将 token 消耗减半，性能损失极小。

开发者生态迅速响应。Kilo Code、Cline 和 Eigent AI 均已确认首日支持。GLM 编程计划的订阅层级起价为 Lite 版每月 12.60 美元，Pro 版每月 50.40 美元，Max 版每月 112.00 美元，分别面向逐步加重的代码库工作负载。

知识图谱（02513.HK），Z.ai 在香港上市的母公司，在公告发布后上涨 0.7%，做空成交量达 9275 万美元——做空比率 2%，显示交易员有一定仓位布局。中金公司将其目标价上调 39% 至 1250 港元，维持"优于大市"评级；摩根大通则将其目标价上调 47% 至 1400 港元，理由是该公司在编程能力方面处于领先地位。

竞争的影响远不止基准测试。鉴于 DeepSeek-V4-Pro 每百万输出 token 收费 0.87 美元，而 GLM-5.2 为 4.40 美元，开源权重模型与专有模型之间的差距已缩小到使领先实验室可能以"90% 以上的利润率"运营的程度——正如 AI 观察者 Lisan al Gaib 在 X 平台上所述。对企业而言，能在不受限制的 MIT 许可证下于主权基础设施上运行前沿级别的 AI，消除了采用的关键障碍——尤其对于受美国出口管制影响的司法管辖区内的组织而言。

本文仅供信息参考，不构成投资建议。