智谱推出原生Agent模型GLM-4.5:国产第一,开源SOTA“一手实测强到离谱”
2 天前 / 阅读约3分钟
来源:凤凰网
可以说GLM-4.5表现和智谱所官宣的是基本一致的

就在刚刚智谱终于推出了开源SOTA王炸模型GLM-4.5

看到智谱新模型GLM-4.5发布,非常开心,也替大家开心,自己开心因为我终于可以和大家聊一下我的看法和使用体验了,替大家开心是是因为这款模型一定会颠覆大家的想象,最近一个月大家的时间线应该被高强度刷屏了Grok 4,Kimi K2,ChatGPT Agent,Qwen3 coder ,那么接下来GLM-4.5表现会怎么样,我们拭目以待

说实话我已经憋了两天了,这次我很有幸拿到了内测资格,几乎没怎么休息,马不停蹄的测试,除了吃饭睡觉都在干活

体验地址:

智谱清言chatglm.cn和 Z.ai 免费体验满血版GLM-4.5

先来了个预告,我对GLM-4.5与三款(Kimi K2,Qwen3 coder,Claude sonnet4 )顶尖模型进行了头对头的的前端测试,还对Claude code 调用GLM-4.5进行了终端对比测试,GLM-4.5表现让我非常震惊,只能说那个曾经的国产大模型六小虎不仅回来了,而且一举达到巅峰,具体请看文章后续测试

GLM-4.5参数与性能表现

两个MoE架构型号,支持 thinking与 non-thinking两种工作模式:

GLM-4.5(总参数355B,激活32B),参数量仅为DeepSeek-R1 的 1/2、Kimi-K2 的 1/3

GLM-4.5-Air(总参数106B,激活12B)

GLM-4.5 在推理、代码、智能体综合能力(平均分)达到开源模型 SOTA 水平,首次在单个模型中实现了推理、代码、Agentic 等多能力原生融合,综合平均分,GLM-4.5 取得了全球模型第三、国产模型第一

SWE-Bench Verified表现非常凶残,相同规模下,GLM-4.5 系列实现了最佳性能

API 调用价格:输入 0.8 元/百万tokens、输出 2 元/百万tokens,远低于主流模型定价,生成速度高速版超过 100 tokens/秒,目前API 已上线开放平台 BigModel.cn,可以一键兼容 Claude Code 框架

一手测试

先声明一下,所有测试都是一次提示,没有经过任何二次提示修改,全程对GLM-4.5,Kimi k2, Qwen3 coder,Claude code sonnet 4进行头对头测试

GLM-4.5 前端测试

1.GLM-4.5生成互动宇宙弦

炫酷的数字艺术,测试模型复杂提示词遵循能力,先直接看最终效果: