返回 2026-06-19
🤖 AI / ML

GLM-5.2 可能是目前最强大的纯文本开源权重大语言模型GLM-5.2 is probably the most powerful text-only open weights LLM

simonwillison.net·2026-06-17

Z.ai 发布了拥有 7530 亿参数和 1.51TB 大小的 GLM-5.2 模型。该模型采用混合专家架构,具有 400 亿激活参数,并且仅支持纯文本输入。GLM-5.2 采用 MIT 许可证完全开放权重,其规模与之前的 GLM-5 和 GLM-5.1 版本相似。作者认为它是目前最强大的纯文本开源权重 LLM。

Simon Willison

2026年6月17日

中国人工智能实验室 Z.ai 于 6 月 13 日向其编码计划订阅者发布了 GLM-5.2,随后在昨天(6 月 16 日)以 MIT 许可证全面开源了模型权重。与之前发布的 GLM-5 和 GLM-5.1 规模相似,这是一个拥有 753B 参数、1.51TB 大小的巨兽模型——包含 40B 激活参数(混合专家模型,Mixture of Experts)。GLM-5.2 是一个纯文本输入模型——Z.ai 拥有一个独立的视觉模型家族,最新代表是 GLM-5V-Turbo,但该模型并未开源权重。GLM-5.2 拥有 100 万 token 的上下文窗口,比 GLM-5.1 的 20 万有了大幅提升。

围绕该模型的热度非常高。

运营着最受广泛认可的独立基准测试之一的 Artificial Analysis 表示:GLM-5.2 是 Artificial Analysis Intelligence Index 上新的领先开源权重模型。

GLM-5.2 是 Intelligence Index v4.1 上的领先开源权重模型。它以 51 分的成绩,领先于 MiniMax-M3(44 分)、DeepSeek V4 Pro(max,44 分)和 Kimi K2.6(43 分)

然而他们确实也发现,该模型相当耗费 token:

在单个任务中,GLM-5.2 比其他领先的开源权重模型使用了更多的输出 token:该模型在每个 Intelligence Index 任务中使用了 4.3 万个输出 token,高于 GLM-5.1(2.6 万),并超过了 MiniMax-M3(2.4 万)、Kimi K2.6(3.5 万)和 DeepSeek V4 Pro(max,3.7 万)

该模型目前在 Code Arena WebDev 排行榜上也位居第二,仅次于 Claude Fable 5。该排行榜衡量的是“前端 Web 开发任务,包括智能体编程工作流”。鉴于它缺乏图像输入功能,能看到它排名如此之高让我印象深刻,我之前曾误以为图像输入是构建真正出色的前端编程模型的关键部分。

我一直在通过 OpenRouter 试用它,该平台提供了 9 家不同供应商的接入服务,几乎所有供应商的输入价格都是 1.40 美元/百万 token,输出价格是 4.40 美元/百万 token。作为对比,GPT-5.5 的价格为 5 美元/30 美元,Claude Opus 4.5-4.8 为 5 美元/25 美元。

出色的鹈鹕,令人失望的负鼠

GLM-5.1 曾为我生成过我最喜欢的鹈鹕之一,以及我有史以来最喜欢的负鼠(提示词为“生成一张骑在电动滑板车上的北弗吉尼亚负鼠的 SVG”)。有趣的是,在这两个例子中,该模型都选择返回包含在 HTML 文档中的 SVG,并使用 CSS 添加了额外的动画。

让我们试试 GLM-5.2。对于“生成一张骑自行车的鹈鹕的 SVG”这个提示词,我得到了这个结果:

这是一个独立且带有完整动画的 SVG,而且动画没有出现破损!通常我会看到眼睛掉下来或者车轮脱离自行车自转的情况,但在这里一切都很完美。这也是一幅非常精美的鹈鹕矢量插画。令人印象深刻。

遗憾的是,那只骑在电动滑板车上的北弗吉尼亚负鼠画得就没那么好了:

这可比 GLM-5.1 退步了太多!提醒一下,之前那只负鼠长这样:

5.2 甚至都没有尝试为它添加动画。

需要完整排版与评论请前往来源站点阅读。