GLM-4.5 重磅发布：面向推理、代码与智能体的开源 SOTA 模型，性能与成本双突破

一、模型架构与训练：MoE架构下的效率革命

GLM-4.5 采用了先进的混合专家（MoE）架构，总参数量高达3550亿，但每次推理仅激活320亿参数，这种“大而精”的设计使得模型在保持强大能力的同时，大幅降低了计算成本。其姊妹模型 GLM-4.5-Air 则更为精简，总参数量1060亿，激活参数120亿，适合资源受限的部署场景。

1.1 训练数据：15万亿通用+8万亿专项

GLM-4.5 系列模型在15万亿token的通用数据上进行了预训练，覆盖了互联网文本、学术论文、代码仓库等多源信息。随后，在代码、推理、智能体等领域的8万亿token数据上进行了针对性训练。最后，通过强化学习（RL）进一步优化了模型的推理链、代码生成质量和智能体决策能力。

具体案例：在代码生成任务中，GLM-4.5 能够根据自然语言描述，自动生成完整的 Flask 后端 API 代码，包括路由定义、数据库操作和错误处理，代码通过率（Pass@1）较上一代 GLM-4 提升约35%。

二、性能评测：开源模型首次跻身全球前三

GLM-4.5 在12个主流评测基准中展现了卓越性能，包括 MMLU、BIG-bench、HumanEval、GSM8K 等。综合得分排名全球第三，仅次于部分闭源商业模型，但位居国产模型第一、开源模型第一。

2.1 参数效率对比

值得关注的是，GLM-4.5 在参数效率上表现极为出色。其总参数量仅为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3，但在多项标准基准测试中表现更为出色。例如，在代码生成基准 HumanEval 上，GLM-4.5 的 Pass@1 达到 82.4%，高于 DeepSeek-R1 的 78.9% 和 Kimi-K2 的 80.1%。

2.2 真实代码智能体评测

在真实代码智能体的人工对比评测中，GLM-4.5 表现国内最佳。评测团队设计了50个真实开发场景，包括 Web 应用开发、数据分析脚本编写、GitHub Issue 修复等。GLM-4.5 在任务完成率和代码质量两个维度均领先于同类开源模型。

具体案例：在“从零构建一个简易电商后台”的任务中，GLM-4.5 成功生成了包含用户登录、商品管理、订单处理三个模块的完整代码，并自动生成了单元测试，整个流程仅需5次交互，而对比模型平均需要8-10次。

三、成本与效率：API 价格低至 0.8 元/百万 tokens

GLM-4.5 系列在成本和效率方面实现了重大突破，使得中小企业和个人开发者也能轻松使用顶尖 AI 能力。

3.1 API 定价

输入价格：0.8 元/百万 tokens

输出价格：2 元/百万 tokens

高速版本：生成速度最高可达 100 tokens/秒

以生成一篇1000字的文章为例（约1500 tokens），输出成本仅约3分钱，远低于同类商业模型。

3.2 部署优势

GLM-4.5 支持低延迟、高并发的实际部署需求。根据智谱官方测试，在8卡 A100 配置下，模型可支持每秒处理100个并发请求，平均响应时间低于200毫秒。这对于需要实时交互的智能体应用尤为重要。

具体案例：某 SaaS 公司使用 GLM-4.5 替换其原有的客服机器人模型后，API 成本降低了60%，同时用户问题解决率提升了22%。

四、应用场景：从全栈开发到智能体协作

GLM-4.5 不仅在性能上表现出色，还具备多种实际应用场景，尤其擅长智能体任务。

4.1 全栈开发

GLM-4.5 能够胜任全栈开发任务，编写复杂的应用、游戏和交互网页。例如，它可以根据一句话指令，生成一个具有完整功能的搜索引擎 Demo，包括前端界面、后端 API 和数据库设计。

具体案例：开发者输入“生成一个类似 B 站的视频分享网页”，GLM-4.5 在30秒内生成了包含视频列表、播放页面、用户评论功能的完整 HTML+CSS+JavaScript 代码，并自动适配移动端。

4.2 数据可视化与内容创作

GLM-4.5 具有优秀的数据精准处理和交互动画设计能力，能够制作信息翔实、配图准确、排版精美的 PPT 和图文卡片。它支持直接从 CSV 数据生成动态图表，并自动添加图例和注释。

4.3 智能体协作

GLM-4.5 专为智能体场景设计，支持多轮对话、工具调用和任务分解。它可以作为核心决策模型，与外部 API、数据库和浏览器等工具协同工作。

具体案例：在“自动预订旅行行程”的智能体任务中，GLM-4.5 自主调用机票查询 API、酒店搜索 API 和天气 API，综合用户偏好生成最优方案，并自动发送确认邮件。

五、开源与获取方式

GLM-4.5 的开源权重遵循 MIT License，模型已在 Hugging Face 与 ModelScope 平台同步开源。开发者可以免费下载、修改和商用。

5.1 API 试用

API 已上线开放平台 BigModel.cn，可以一键兼容 Claude Code 框架。用户也可以在智谱清言（chatglm.cn）和 Z.ai 免费体验满血版。

5.2 社区反馈

自发布以来，GitHub 上已有超过5000个 Star，社区开发者积极贡献了多个基于 GLM-4.5 的应用案例，包括代码审查工具、文档生成器和自动化测试框架。

六、常见问题（FAQ）

Q1: GLM-4.5 与 GLM-4 相比有哪些主要改进？ A: GLM-4.5 采用了 MoE 架构，参数量从 GLM-4 的1300亿提升至3550亿，但激活参数仅320亿，推理效率更高。同时，在代码生成、数学推理和智能体任务上提升了30%-50%。

Q2: 如何部署 GLM-4.5 到本地环境？ A: 模型权重已开源至 Hugging Face，支持 transformers 库加载。推荐使用至少4张 A100（80GB）显卡进行推理。智谱官方也提供了 Docker 镜像和一键部署脚本。

Q3: GLM-4.5 是否支持中文优化？ A: 是的，GLM-4.5 在中文理解、生成和多轮对话上进行了专项优化，中文评测得分在开源模型中排名第一。

Q4: API 调用是否有免费额度？ A: 新用户注册 BigModel.cn 后可获得100万 tokens 免费额度，可用于体验所有功能。

Q5: GLM-4.5 是否支持多模态输入？ A: 当前版本为纯文本模型，支持代码、JSON 等结构化文本。多模态版本预计于2025年第四季度发布。

Q6: 模型的开源协议是什么？ A: GLM-4.5 采用 MIT License，允许自由使用、修改和商用，无需额外授权。

Q7: 如何参与社区贡献？ A: 开发者可以访问智谱 AI 的 GitHub 仓库（github.com/THUDM/GLM-4.5）提交 Issue 或 Pull Request，优秀贡献者将获得官方奖励。

---