AI 大模型编程 GLM-5

智谱 GLM-5 实测：对比 Opus 4.6 和 GPT-5.3-Codex

作者：阮一峰 | 日期：2026-02-12 | 评分：⭐⭐⭐⭐⭐

概述

智谱新一代旗舰模型 GLM-5 正式发布，正面对比 Anthropic 的 Claude Opus 4.6 和 OpenAI 的 GPT-5.3-Codex。

GLM-5 核心特性

复杂系统工程：不单善于生成前端网页，更善于处理后端任务、系统重构、深度调试
长程 Agent：能够跑长程任务，多阶段、长步骤的复杂任务，可自主连续运行数小时
完全开源：作为开源模型，GLM-5 完全对标顶尖闭源模型

实测对比

使用 HuggingFace 布道师的同一测试题目，对比三个 AI 模型的编程能力：

测试题目

网页设计和重构能力测试，将简陋的信息分类页面重新设计为美观易用的专业页面。

测试结果

GLM-5：生成结果美观又专业，所有信息组织得井井有条，带有动画效果，手机浏览也没问题
Claude Opus 4.6：结果可用，设计美观
GPT-5.3：页眉没做成粘性页眉（往下拉就没了），设计上不如另外两者好看

GLM-5 可以完成的任务，已经超越了生成前端 UI，而是可以生成系统级大型复杂项目，比如操作系统内核、浏览器内核、V8 引擎之类的。

亮点

真实编程任务测试，不是泛泛而谈
有截图对比，直观展示生成效果
开源模型对标闭源顶级模型，值得关注
个人开发者可以免费使用

相关链接