🪨 Caveman: 为什么用更多token时few token也能搞定
核心发现
一个 Claude Code 技能/插件,让AI用"原始人语言"交流,可在保持100%技术准确性的同时削减约75%的token消耗。基于2026年3月的 arXiv 论文"Brevity Constraints Reverse Performance Hierarchies"。
实测数据
| 任务 | 正常 (tokens) | Caveman (tokens) | 节省 |
|---|---|---|---|
| 解释 React re-render bug | 1180 | 159 | 87% |
| 修复 auth middleware token expiry | 704 | 121 | 83% |
| 设置 PostgreSQL 连接池 | 2347 | 380 | 84% |
| 实现 React error boundary | 3454 | 456 | 87% |
| 平均 | 1214 | 294 | 65% |
科学依据
2026年3月 arXiv 论文 "Brevity Constraints Reverse Performance Hierarchies in Language Models" 发现:
- 大型模型在7.7%的基准测试问题上表现不如小模型,差距达28.4个百分点
- 原因:大型模型倾向于过度冗余,通过过度解释引入错误
- 强制简洁可将准确率提升26个百分点
- 简洁约束可完全逆转性能层级:大模型在小模型擅长的数学推理和科学知识基准上反而领先7.7-15.9个百分点
Caveman 工作原理
- 🪨 删除填充词:删除"当然"、"很高兴"、"值得注意的是"等客套话
- ✍️ 保留技术术语:polymorphism 仍然是 polymorphism
- 📋 保留代码块:代码块正常输出
- 💀 删除冠词:a, an, the 全部去掉
- 💀 删除委婉语:"It might be worth considering" 等表述移除
安装使用
# Claude Code
npx skills add JuliusBrussee/caveman
# 或
claude plugin install caveman@caveman
# Codex
克隆仓库 → 打开 Codex → /plugins → 搜索 Caveman → 安装
# 触发方式
/caveman
"talk like caveman"
"caveman mode"
"less tokens please"
关键洞察
重要:Caveman 只影响输出token,不影响思考/reasoning token。不是让AI变笨,而是让AI少说废话。
这揭示了一个重要趋势:2026年的AI提示工程范式正在从"详细描述"转向"简洁约束"——不是给更多指令让它做更多,而是给限制让它更精确。