找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 42|回复: 0

智谱开源GLM-4.7大模型 编程与推理能力提升明显!

[复制链接]

3663

主题

0

回帖

1万

积分

管理员

积分
11265
发表于 2025-12-23 10:00:47 | 显示全部楼层 |阅读模式
【CNMO科技消息】12月23日,智谱AI正式发布并开源新一代大语言模型GLM-4.7。该版本聚焦编程、推理与智能体任务三大方向,在多项国际主流基准测试中取得开源模型领先成绩,并已在BigModel.cn平台开放API调用,同步集成至z.ai全栈开发环境的Skills模块,支持多模态任务的统一规划与协同执行。



GLM-4.7在真实编程场景中表现尤为突出。在Code Arena——一个由全球百万用户参与盲测的专业编码评估系统中,其综合得分位列开源第一、国产第一,超越GPT-5.2。在SWE-bench-Verified、LiveCodeBench V6等权威测试中,模型分别以73.8%和84.9%的成绩刷新开源纪录,甚至超过Claude Sonnet 4.5。实际测试显示,在100个涵盖前后端开发的真实任务中,GLM-4.7相较前代在代码稳定性与可交付性上显著提升,能更可靠地完成从需求理解到可运行代码输出的端到端开发闭环。

除编码能力外,GLM-4.7进一步优化了“思考”机制。通过强化交错式思考、引入保留式思考与轮级思考模式,模型可在复杂任务中动态调整推理深度:简单交互快速响应,复杂规划则保留上下文推理链,提升缓存效率并降低成本。在工具调用方面,其在τ-Bench评测中获得87.4分的开源最高分,在BrowseComp网页任务中达67.5分,展现出强大的环境交互能力。



此外,GLM-4.7在前端生成与办公创作领域也实现审美升级。生成的网页、PPT与海报在布局、配色与组件规范上更贴近专业设计标准,PPT 16:9适配率从52%跃升至91%,基本实现“即开即用”。数学推理能力同样进步显著,在HLE基准测试中得分42.8%,较GLM-4.6提升41%,超越GPT-5.1。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|花享网 ( 琼ICP备2024046163号-1 )

GMT+8, 2026-1-16 07:23 , Processed in 0.098634 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表