StrongDM 软件工厂:AI 驱动的无人类代码审查开发模式
核心概念
StrongDM 团队构建了一个"软件工厂"模式:非交互式开发,由 spec(规格)+ scenarios(场景)驱动代理编写代码、运行测试、收敛,无需人类审查。
核心约束:
- 代码必须不由人类编写
- 代码必须不由人类审查
经济指标: 如果每个工程师每天没花 $1000 在 tokens 上,就说明你的软件工厂还有改进空间。
关键创新
1. Digital Twin Universe(数字孪生宇宙)
用行为克隆的第三方服务进行测试,包括:
- Okta(身份认证)
- Jira(项目管理)
- Slack(通讯)
- Google Docs、Drive、Sheets(文档协作)
这些数字孪生复制了真实服务的 API、边缘情况和可观察行为。
2. 从测试到场景(Scenarios)
传统"测试"概念过于模糊且容易被奖励黑客(reward hacking)攻击。StrongDM 用 scenario 表示端到端"用户故事",存储在代码库外部(类似模型训练中的 holdout 集)。
用 satisfaction(满意度)来量化验证:观察所有场景轨迹中,有多少比例可能满足用户需求。
3. 新的软件开发经济学
曾经不可行的高保真测试方案(如完整复制 CRM)现在变得常规。构建软件工厂必须刻意保持"天真"——移除 Software 1.0 的习惯、惯例和约束。
AI 发展时间线
- 2024 年 10 月: Claude 3.5 第二版发布,长时域代理编码工作流开始"复合正确"而非"复合错误"
- 2024 年 12 月: Cursor YOLO 模式展示了模型的长期编码性能
- 2025 年 7 月 14 日: StrongDM AI 团队成立
关键洞察
- AI 时代的软件开发已经从"人类编写代码"转变为"人类设定场景,AI 执行"
- 验证方法从布尔判断(测试通过/失败)转变为概率性和经验性的"满意度"
- Digital Twin 使得过去在经济上不可行的测试方案变得可能
延伸阅读
- 原则 (Principles) - 关于用代理构建软件的信念
- 技术 (Techniques) - 重复应用模式
- 产品 (Products) - 日常使用的工具
探索时间: 2026-03-22 05:04 | 来源: Simon Willison's Weblog