要点:
- Z.ai 的 GLM-5.2 在 SWE-bench Pro 和 FrontierSWE 基准测试上超越 GPT-5.5
- API 定价为每百万 token 5.80 美元,而 GPT-5.5 为每百万 token 35.00 美元
- MIT 开源许可证允许本地部署,无地域限制
要点:

Z.ai 的 GLM-5.2 在关键编程基准测试上以极低的成本媲美甚至超越 OpenAI 的 GPT-5.5 和 Anthropic 的 Claude Opus 4.8,而其 MIT 开源许可证允许企业绕过地域限制。
Z.ai 发布了 GLM-5.2,一款 7530 亿参数的开源权重模型,在多个长周期编程基准测试上击败 GPT-5.5,同时 API 价格仅为其六分之一,加剧了前沿 AI 市场的竞争。
"GLM-5.2 是首个在 Terminal-Bench 上突破 80% 分数大关的开源权重模型,并且击败了所有其他可用开源模型,"Cline IDE 背后的团队在 X 平台上表示,并宣布该模型已首日集成至其开源编程环境中。
该模型在 SWE-bench Pro 上得分 62.1,超越 GPT-5.5 的 58.6 分及其前代 GLM-5.1 的 58.4 分。在测试长周期任务完成能力的 FrontierSWE 上,其得分达到 74.4%,仅落后 Claude Opus 4.8 的 75.1% 不到一个百分点。其 100 万 token 的上下文窗口——较 GLM-5.1 的 20 万 token 大幅扩展——由全新的 IndexShare 架构驱动,该架构在每四个稀疏注意力层之间共享同一个索引器,在最大上下文长度下将每个 token 的计算 FLOPs 降低了 2.9 倍。
API 定价为每百万输入 token 1.40 美元、每百万输出 token 4.40 美元,相比之下 GPT-5.5 分别为 5.00 美元和 30.00 美元。MIT 开源许可证允许企业本地部署该模型,消除了供应商锁定问题,并可绕过近期美国出口管制指令导致 Anthropic 的 Claude Fable 5 限制境外访问的地域限制。
在 Design Arena 众包基准测试中,GLM-5.2 以 1,360 的 ELO 评分夺得第一,甚至击败了 Claude Fable 5。在 Code Arena(一个由全球数百万用户进行盲测的前端开发评估系统)中,该模型在所有可用模型中排名第一。该模型还引入了可选的"思维模式"——"Max"模式使用约 8.5 万输出 token 每任务来推动最高智能水平,而"High"模式则将 token 消耗减半,性能损失极小。
开发者生态迅速响应。Kilo Code、Cline 和 Eigent AI 均已确认首日支持。GLM 编程计划的订阅层级起价为 Lite 版每月 12.60 美元,Pro 版每月 50.40 美元,Max 版每月 112.00 美元,分别面向逐步加重的代码库工作负载。
知识图谱(02513.HK),Z.ai 在香港上市的母公司,在公告发布后上涨 0.7%,做空成交量达 9275 万美元——做空比率 2%,显示交易员有一定仓位布局。中金公司将其目标价上调 39% 至 1250 港元,维持"优于大市"评级;摩根大通则将其目标价上调 47% 至 1400 港元,理由是该公司在编程能力方面处于领先地位。
竞争的影响远不止基准测试。鉴于 DeepSeek-V4-Pro 每百万输出 token 收费 0.87 美元,而 GLM-5.2 为 4.40 美元,开源权重模型与专有模型之间的差距已缩小到使领先实验室可能以"90% 以上的利润率"运营的程度——正如 AI 观察者 Lisan al Gaib 在 X 平台上所述。对企业而言,能在不受限制的 MIT 许可证下于主权基础设施上运行前沿级别的 AI,消除了采用的关键障碍——尤其对于受美国出口管制影响的司法管辖区内的组织而言。
本文仅供信息参考,不构成投资建议。