智谱GLM47Coding开源第一其他也很强
开源 coding 模型,终于卷到 Claude Sonnet 4.5 头上了。
智谱再次放出大招, 正式发布并开源 GLM-4.7!

这是一款专为 Agentic Coding 打造的模型, 在 LiveCodeBench V6 上拿下 84.8 分,直接超越了 Claude Sonnet 4.5。

而这个时间点也颇为微妙:就在几天前,智谱的港股招股书刚刚挂网,冲击「 全球大模型第一股 」。
技术突破 + 资本加持,可谓是 双喜临门 。
屠榜开源 + 紧逼闭源
先来看看 GLM-4.7 的成绩单之猛:
编程能力:

LiveCodeBench V6: 84.8 分,开源 SOTA ,超越 Claude Sonnet 4.5
LMArena Code Arena 盲测: 开源第一、国产第一 ,超越 GPT-5.2
SWE-bench Verified: 国产第一
推理能力:
AIME 2025 数学竞赛: 开源 SOTA ,超越 Claude Sonnet 4.5 和 GPT-5.1
HLE(Human Last Exam): 42% ,比 GLM-4.6 提升 38% ,接近 GPT-5.1
Agent 能力:
BrowseComp 网页任务评估: 67 分
τ²-Bench 真实世界交互评估: 开源 SOTA ,接近 Claude Sonnet 4.5(84.7 分)

Mikel(@MikelEcheve) 称 GLM-4.7 简直就是个「编程怪兽」:
GLM-4.7 来了,这是一个编程怪兽 🤖💥
它在 LiveCodeBench V6 上拿到 84.8 分,超越了 Claude 4.5。
还有:
LM Arena(开源)第一
比 GLM-4.6 提升 38%
HLE benchmark 42%
开源正在光速前进。关注 @Zai_org 🚀
Rogue(@Rogue0114) 称:
智谱刚刚发布了 GLM-4.7,他们在某些 benchmark 上是最好的开源模型,而且和 Claude Sonnet 4.5 一样强。
这帮人太能整了。
而最大的意义在于, 开源才是人类进步的根本驱动力。

模型规格
GLM-4.7 核心参数如下:
输入/输出模态 :文本(暂无视觉能力,估计 GLM-4.7V 正在路上)
上下文长度 :200K
最大输出 token :128K

支持的能力包括:思考模式(Thinking Mode)、流式输出、Function Call、上下文缓存、结构化输出。

值得一提的是,GLM-4.7 提供了 多种思考模式 ,可以在对话中按轮次切换是否启用思考,还将「交错式思考」升级为「保留式思考」,让复杂任务的连续推理更稳定。

模型价格
GLM-4.7 的完整定价如下(单位:美元):

作为对比,Claude Sonnet 4.5 的定价是输入 $3/MTok、输出 $15/MTok。
GLM-4.7 的输入价格只有 Claude Sonnet 4.5 的五分之一,输出价格不到七分之一 ,而在 LiveCodeBench V6 上的表现还更胜一筹。
对比下来,可以说是简直不能更香了。
Coding Plan:性价比之选
智谱专门为 AI 编程推出了 GLM Coding Plan 订阅套餐, 起价仅 $3/月 ,支持 Claude Code、Cline、OpenCode、Roo Code 等主流编程工具。
(再一次心疼我 200$ 的 Claude Max,这个月用完就又得退了……)

本次 GLM-4.7 融入 Coding Plan 后,带来了几个显著升级:
Claude Code 全面支持思考模式 ,支持轮级切换,复杂任务的连续推理更稳定
针对 Skills / Subagent / Claude.md 等关键能力做定向优化 ,工具调用成功率更高
Claude Code 中智谱专属 MCP 免安装 ,视觉理解能力开箱即用,可以直接解析截图、设计稿、报错图
内置搜索与网页读取 ,信息获取到代码落地一站闭环
前端审美更出色 ,页面构建的整体观感进一步提升
已订阅 GLM Coding Plan 包月套餐的用户,将 自动升级至 GLM-4.7 。

作为「体验进化季」的首个惊喜,购买套餐的用户都将获得「体验卡」礼包,可邀请 3~7 位新用户好友免费体验 7 天 的套餐权益。
而离谱的是,GLM 4.7 的 1 年订阅(接近 Opus 4.5 级别)= Codex/Claude Code 的 1 个月 Max Plan。

依旧是欢迎用我的码(且收益全部转发群中,群见评论区):
https://z.ai/subscribe?ic=UDMXEJSSXQ
牛刀小试
光看 benchmark 和 coding 指标,感觉有点不像是真的,会不会有「刷榜」的嫌疑,GLM-4.7 的底层能力(智商)实际如何呢?
我也照旧,用这道模型智商基本功的测试题试了一下:
我有70块钱,我借给小明五十块钱,他又用这五十块在我这里买了五十块钱的水果。第二天我借给小明30块钱,小明用这30块钱买了30块钱的牛奶,小明还欠我多少钱?请先推理,最后给出结论。
要知道,这道题看似简单,实则暗藏陷阱。
很多模型会被「 买东西 」这个动作迷惑,弄不清钱到底有没有回到了你手里。
GLM-4.7 经过一番思考后,最终回答: 小明还欠你 80 块钱。

答案正确!
推理稳定,没有翻车。
有兴趣的朋友可以拿这道题去测测其他模型,看看谁会中招,言过其实
而 GLM-4.7 除了基础智商和编程能力,还有超强的前端能力及 PPT 能力,所以我还测了另一个关于 Skills 和 MCP 的 PPT case ——在我上次的文章 MCP 或将成弃子 后,确实 Skills 正受到更多人的关注,于是我让 GLM-4.7 给出制作一个关于 Skills 和 MPC 差异的 PPT:

GLM-4.7 经过多轮的检索思考后给出了最终的 PPT,内容全面,配色也恰当好处拿捏的很准确:






<<< 左右滑动见更多 >>>
使用大全
GLM-4.7 的使用方式也是做足了准备,全面上线:
国内用户:
智谱 MaaS 平台(bigmodel.cn)
智谱清言
海外用户:
z.ai
OpenRouter
开源部署:
GLM-4.7 模型也已在 Hugging Face、ModelScope 发布,采用 MIT 协议
企业用户:
可通过 bigmodel.cn 直接购买 Coding Plan 企业版套餐
API 调用示例:
curl -X POST "https://api.z.ai/api/paas/v4/chat/completions" -H "Content-Type: application/json" -H "Authorization: Bearer your-api-key" -d '{ "model": "glm-4.7", "messages": [ { "role": "user", "content": "你的问题" } ], "thinking": { "type": "enabled" }, "max_tokens": 4096, "temperature": 1.0 }'
Python SDK 调用:
from zai import ZaiClientclient = ZaiClient(api_key="your-api-key")response = client.chat.completions.create( model="glm-4.7", messages=[ {"role": "user", "content": "你的问题"} ], thinking={"type": "enabled"}, max_tokens=4096, temperature=1.0,)print(response.choices[0].message)
也支持直接用 OpenAI 的 Python SDK,只需改一下 base_url:
from openai import OpenAIclient = OpenAI( api_key="your-Z.AI-api-key", base_url="https://api.z.ai/api/paas/v4/",)completion = client.chat.completions.create( model="glm-4.7", messages=[ {"role": "user", "content": "你的问题"} ],)
双喜临门
就在 GLM-4.7 发布前几天,智谱的港股招股书正式挂网。
根据招股书披露:
版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/44.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论