发布日期:2026-06-17 | 话题:AI 编程模型 | 适用人群:开发者、AI 工程师

GLM-5.2 是智谱 AI(Z.ai)于 2026 年 6 月发布的最新旗舰模型,753B 参数,MIT 开源,已上传 Hugging Face(zai-org/GLM-5.2),支持 vLLM / SGLang 本地部署。发布当日,GLM-5.2 在 Design Arena 以 Elo 1360 分登顶第一,超越目前已下线的 Claude Fable 5;在 Code Arena 前端榜单排名第二,仅次于 Fable 5,领先 Claude Opus 4.7 Thinking 达 29 分;在 Agent Arena 排名第十,是所有开源模型中的最高分,与 Claude Opus 4.8(非思考模式)表现相当。第三方测评(AICodeKing KingBench)评价其"代码洁净度极高、UX 设计品味出众、One-shot 能力强",曾在 30 分钟内独立完成本地模型微调任务。本文系统梳理 GLM-5.2 的基准数据、能力特点、与竞品的真实差距,以及 API 接入和本地部署方法。

 

GLM-5.2 是什么?

GLM-5.2 由智谱 AI(Z.ai,原清华大学知识工程组 THUDM 团队)发布,是 GLM 系列的最新版本,定位为编程与 Agent 任务的旗舰模型。

关键参数:

参数

数值

总参数量

753B

架构

GLM MoE DSA

上下文窗口

1M tokens(官方确认)

开源协议

MIT

HuggingFace

zai-org/GLM-5.2

支持部署框架

Transformers、vLLM、SGLang、Docker

GLM-5.2 同步发布 FP8 量化版本(zai-org/GLM-5.2-FP8),降低部署显存需求,适合有本地推理需求的团队。ChatGLM 网页版已同步接入 GLM-5.2,官方同期上线 1M 上下文窗口,并推出积分充值优惠活动。

 

基准成绩:三大 Arena 数据

Design Arena:登顶第一

Design Arena(@Designarena)6 月 16 日公告:

 GLM-5.2 Elo 1360排名第一

 超越目前已下线的 Claude Fable 5(此前排名第一)

 较上个版本提升 4 个名次、27 Elo 分

 开源权重,可自部署

Code Arena 前端榜单:排名第二

Arena.ai(@arena)6 月 16 日公告:

 Code Arena 前端榜单 排名第二,仅次于 Fable 5

 领先 Claude Opus 4.7 Thinking +29 分

 React 子榜 #2、HTML 子榜 #4

 细分类目第一:品牌营销、参考设计、数据分析、消费品、游戏、仿真模拟

 开源模型中以大幅优势领先 Kimi-K2.6 和 Minimax-M3

Agent Arena:开源第一

 Agent Arena 排名第 10开源模型第一

 与 Claude Opus 4.8(非思考模式)表现相当

 测试覆盖数百万真实世界长时程 Agent 任务

 

第三方评测:AICodeKing KingBench

AICodeKing(@aicodeking,225K+ 浏览量)6 月 13 日实测评价:

“代码始终非常干净。它更擅长 UX 而非 UI。One-shot 能力出众。我让它微调一个完整的本地模型,它在 30 分钟内完成了!这是一个全面的优秀模型。”

AI 编程社区评测(@OmedVibeCodes,AI Benchmark #4)将 GLM-5.2 与 Kimi K2.7 Code、Claude Opus 4.8 High、GPT-5.5 High 同台对比,评价 GLM-5.2 “表现惊人”。

 

能力特点分析

根据 Arena 数据和第三方评测,GLM-5.2 的优势集中在以下方向:

前端与设计类任务(最强项)

 Design Arena 第一,UX/UI 生成品味突出

 品牌营销、参考设计、消费品类目均拿下 Arena 细分第一

 One-shot 完整页面/组件生成质量高

Agent 长任务执行

 Agent Arena 开源第一,与顶级闭源模型差距缩小

 1M 上下文支持超长代码库整体分析

 实测 30 分钟内完成本地模型微调全流程

代码洁净度

 第三方评测一致强调代码结构干净、可读性高

 适合需要直接合并到生产代码库的场景

与竞品的差距

Code Arena 综合编程榜(非前端专项)中,GLM-5.2 与 GPT-5.5 High 和 Claude Opus 4.8 仍有一定差距,前端与设计类任务是其最突出的优势区间。

本地部署

GLM-5.2 MIT 开源,支持多种框架本地部署:

vLLM 部署(推荐生产环境):

 

pip install vllm
vllm serve "zai-org/GLM-5.2"

启动后通过 OpenAI 兼容 API 调用:

 

curl -X POST "http://localhost:8000/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "zai-org/GLM-5.2",
    "messages": [{"role": "user", "content": "帮我写一个 React 组件"}]
  }'

SGLang 部署:

 

pip install sglang
python3 -m sglang.launch_server \
    --model-path "zai-org/GLM-5.2" \
    --host 0.0.0.0 \
    --port 30000

Docker 一键启动:

 

docker model run hf.co/zai-org/GLM-5.2

Transformers 直接调用:

 

from transformers import pipeline
 
pipe = pipeline("text-generation", model="zai-org/GLM-5.2")
messages = [{"role": "user", "content": "帮我重构这段代码"}]
pipe(messages)

 

API 接入:无需自部署

不想自己部署 753B 模型的开发者,可通过 ChatGLM 网页版(chatglm.cn)直接使用,或通过支持 GLM-5.2 的 API 平台接入。多模型统一接入平台可在同一接口下按需切换 GLM-5.2 与其他主流模型,方便横向对比验证。七牛云 AI 大模型广场收录了包括 GLM 系列在内的多款主流大模型,国内可直接访问。

 

常见问题 FAQ

Q1:GLM-5.2 和 GLM-5.1 有什么区别?

GLM-5.2 是 GLM-5.1 的迭代升级版,参数量相近(GLM-5.1 为 754B,GLM-5.2 为 753B),主要改进集中在编程和 Agent 能力,上下文窗口从此前版本扩展至 1M tokens。具体架构差异以官方技术报告(arxiv: 2603.12201)为准。Q2:Design Arena 第一是怎么评出来的?

Design Arena 采用人类偏好投票(Elo 评分机制),用户在同一任务下对两个模型的输出盲测投票,累积投票生成 Elo 排名。GLM-5.2 以 Elo 1360 超越此前第一的 Claude Fable 5(现已下线),是实际用户投票的结果,非单一基准测试。Q3:753B 模型本地部署需要多少显存?

FP16 完整加载约需 1.5TB 显存,通常需要多机多卡集群。FP8 量化版(zai-org/GLM-5.2-FP8)可将显存需求减半,适合有 8×H100 或同等配置的团队。个人开发者建议通过 API 方式访问。Q4:GLM-5.2 适合替代 Claude Opus 4.8 做编程 Agent 吗?

前端、设计类和 UX 生成任务可以优先考虑 GLM-5.2,其 Design Arena 和 Code Arena 前端榜表现已超越 Opus 4.8;综合编程和复杂推理任务目前 Opus 4.8 仍有优势。实际项目建议两者同台测试后按场景选型。Q5:MIT 开源协议可以商用吗?

MIT 协议允许商业使用,无需支付授权费,可修改和私有部署,仅需保留版权声明。具体以 HuggingFace 仓库(zai-org/GLM-5.2)的 License 文件为准。

小结

GLM-5.2 是 2026 年 6 月国产开源模型的重要里程碑:Design Arena 第一(Elo 1360)、Code Arena 前端榜第二、Agent Arena 开源第一,753B 参数 MIT 开源可商用,1M 上下文支持超长任务。前端与设计类编程任务是其最突出的优势,综合编程基准与 GPT-5.5 和 Claude Opus 4.8 仍有差距。本文数据来自 Arena.ai、Design Arena、AICodeKing 及 HuggingFace zai-org 主页,2026-06-16/17,具体基准分数以各平台最新排行榜为准。

 

参考来源:

 Design Arena 官方公告(@Designarena,2026-06-16)

 Arena.ai 官方公告(@arena,2026-06-16)

 AICodeKing KingBench 评测(@aicodeking,2026-06-13)

 Coding plan模型页:GLM-5.2

 多模型统一接入与对比测试:七牛云 AI 大模型广场