Does Computer Science Still Exist?
核心发现
"从Hack到NetHack的悬崖表明,AI编程不是程度问题,而是性质差异。"
摘要
作者是AI研究员,用AI代理移植经典游戏Rogue、Hack和NetHack,探索AI编程时代计算机科学的未来。
关键亮点
- Rogue: 8,400行C代码,AI代理85分钟完成移植,达到近100%测试覆盖率
- Hack: 6,200行C代码,核心移植8小时,后续15小时达到完整覆盖
- NetHack: 420,000行C代码,AI代理陷入"复杂性悬崖"
- 复杂性悬崖: NetHack中任何物体可以与任何怪物、地形、状态交互,组合爆炸
- 代理工作模式转变: 从独立工作变成需要"工程管理"
- 基础设施需求: AGENTS.md定义、8种调试工作流、dbgmapdump诊断工具
- Goodhart定律: 测试覆盖率成为目标后失去意义
核心洞察
AI可以快速完成小型项目,但面对大型、相互连接的系统时遇到本质困难。代理需要:
- 人类定义调试工作流
- 构建诊断工具暴露隐藏状态
- 工程管理而非直接编程
分类
AI编程 | 计算机科学 | 教育 | 未来趋势