Self-Improving Coding Agents
核心理念: 设置自主编码代理循环,让 AI 在你睡觉时写代码、测试、准备 review。核心是"Ralph Wiggum"技术 + AGENTS.md 知识积累。
核心机制:连续编码循环
Ralph Wiggum 技术
- 从 to-do 列表中选取下一个任务
- 实现任务 - Agent 写代码
- 验证变更 - 运行测试
- 如果检查通过,提交代码
- 更新任务状态并记录学习
- 重置 Agent 上下文,重复直到完成
关键设计:无状态但迭代
每次迭代重置 Agent 记忆,避免上下文溢出导致模型漂移或遗忘细节。这种"stateless but iterative"设计是可靠性的关键。
AGENTS.md:知识库累积
每个任务后追加关键学习:
- Patterns & Conventions: 高层模式(如 SSR、组件目录结构)
- Gotchas: Agent 或开发者踩过的坑
- Style/Preferences: 代码风格偏好
- Recent Learnings/Changes: 近期问题和解决方案
每个改进都应该让未来的改进更容易。
四层记忆机制
- Git Commit History: 每次迭代的代码变更都被 commit,下一次可以通过 git diff 查看
- Progress Log (progress.txt): 纯文本日志,记录每次尝试的任务和结果
- Task State (prd.json): JSON 文件持久化任务状态
- AGENTS.md: 长期语义记忆
质量保证:测试和验证循环
- 单元测试和集成测试
- 类型检查和 Linting
- CI 集成
- AI 自我评估(可选)
测试是将不可靠的 Agent 转变为可靠系统的关键。
扩展:并发 Agent 和多循环编排
Cursor 的实验:Planner-Worker 模型。Planners 读取代码库、决定需要做什么、生成任务。Workers 实现任务。Judge Agent 评估目标是否达成。
结果:数百个 Agent 同时工作,一周内生成超过 100 万行代码。
关键技巧
- 任务要足够小,能在一个 AI session 内完成
- 每个任务要有清晰的 pass/fail 标准
- 保持 AGENTS.md 精简,周期性归档过时信息
- 定期验证 Agent 实际使用了记忆文件