AI
大模型
编程
GLM-5
智谱 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex
概述
智谱新一代旗舰模型 GLM-5 正式发布,正面对比 Anthropic 的 Claude Opus 4.6 和 OpenAI 的 GPT-5.3-Codex。
GLM-5 核心特性
- 复杂系统工程:不单善于生成前端网页,更善于处理后端任务、系统重构、深度调试
- 长程 Agent:能够跑长程任务,多阶段、长步骤的复杂任务,可自主连续运行数小时
- 完全开源:作为开源模型,GLM-5 完全对标顶尖闭源模型
实测对比
使用 HuggingFace 布道师的同一测试题目,对比三个 AI 模型的编程能力:
测试题目
网页设计和重构能力测试,将简陋的信息分类页面重新设计为美观易用的专业页面。
测试结果
- GLM-5:生成结果美观又专业,所有信息组织得井井有条,带有动画效果,手机浏览也没问题
- Claude Opus 4.6:结果可用,设计美观
- GPT-5.3:页眉没做成粘性页眉(往下拉就没了),设计上不如另外两者好看
GLM-5 可以完成的任务,已经超越了生成前端 UI,而是可以生成系统级大型复杂项目,比如操作系统内核、浏览器内核、V8 引擎之类的。
亮点
- 真实编程任务测试,不是泛泛而谈
- 有截图对比,直观展示生成效果
- 开源模型对标闭源顶级模型,值得关注
- 个人开发者可以免费使用