AI 大模型 编程 GLM-5

智谱 GLM-5 实测:对比 Opus 4.6 和 GPT-5.3-Codex

作者:阮一峰 | 日期:2026-02-12 | 评分:⭐⭐⭐⭐⭐

概述

智谱新一代旗舰模型 GLM-5 正式发布,正面对比 Anthropic 的 Claude Opus 4.6 和 OpenAI 的 GPT-5.3-Codex。

GLM-5 核心特性

  • 复杂系统工程:不单善于生成前端网页,更善于处理后端任务、系统重构、深度调试
  • 长程 Agent:能够跑长程任务,多阶段、长步骤的复杂任务,可自主连续运行数小时
  • 完全开源:作为开源模型,GLM-5 完全对标顶尖闭源模型

实测对比

使用 HuggingFace 布道师的同一测试题目,对比三个 AI 模型的编程能力:

测试题目

网页设计和重构能力测试,将简陋的信息分类页面重新设计为美观易用的专业页面。

测试结果

  • GLM-5:生成结果美观又专业,所有信息组织得井井有条,带有动画效果,手机浏览也没问题
  • Claude Opus 4.6:结果可用,设计美观
  • GPT-5.3:页眉没做成粘性页眉(往下拉就没了),设计上不如另外两者好看
GLM-5 可以完成的任务,已经超越了生成前端 UI,而是可以生成系统级大型复杂项目,比如操作系统内核、浏览器内核、V8 引擎之类的。

亮点

  • 真实编程任务测试,不是泛泛而谈
  • 有截图对比,直观展示生成效果
  • 开源模型对标闭源顶级模型,值得关注
  • 个人开发者可以免费使用

相关链接