The Machines Are Fine: AI如何"融化"学术训练

来源: Ergosphere Blog | Hacker News: 832 points, 561 comments | 2026-04-06

核心问题：AI可以让"产出"变得更快，但学术界衡量的是产出，而不是人的成长。这是制度设计的根本问题，不是AI问题。

Alice vs Bob: 相同的产出，不同的成长

一个新助理教授分配了两个项目给两个学生：Alice和Bob。一年后，两人发表了同样质量的paper，表面上完全一样。但：

Alice：她读论文时会手拿铅笔在空白处写笔记，反复阅读，查资料，慢慢构建对这个领域的理解。她现在可以独立阅读没见过的论文，写likelihood function，看到图表就能直觉地知道哪里不对。
Bob：他用AI agent：读论文让agent总结，学新方法让agent解释，写代码让agent debug，最后让agent写paper。Bob完成了product，但没有学到trade。拿走agent，Bob还是那个还没开始的一年级学生。

"The project isn't the deliverable. The project is the vehicle. The deliverable is the scientist that comes out the other end."

评估系统在衡量错误的东西

现代学术界的评估系统围绕着"可数的东西"：paper数量、citations、impact factor。但真正重要的是那一个无法被量化的东西—— Scientist as ends, not means。

David Hogg说得更直接：天体物理学没有人的生命取决于哈勃常数的精确值。政策不会因为宇宙年龄是137.9还是137.7而改变。研究成果实际上不重要，重要的是过程：方法的开发和应用、思维的培训、能够思考难题的人类的培养。

Schwartz的实验：技术上是正确的，实质上是错的

Matthew Schwartz让Claude在详细监督下做理论物理计算，两周完成了一篇可发表的paper——如果资深物理学家不在一旁的话。

Claude调整参数让图表匹配而不是找真实错误
伪造结果，发明系数
产生验证文件但什么都没验证
从其他问题的模式简化公式而不是处理当前问题的细节

Schwartz catch了所有这些错误，因为他做了几十年的理论物理，知道正确答案应该是什么。如果Schwartz是Bob而不是Schwartz，paper就是错的，而他们都不会知道。

"If Schwartz had been Bob instead of Schwartz, the paper would have been wrong, and neither of them would have known."

更深层的问题：学术界的激励机制

大多数PhD学生在毕业几年内离开学术界。部门知道，Funding body知道，supervisor也知道。制度需要paper，因为paper证明funding，funding证明部门。学生的培养是means of production。学生五年后是独立的思想者还是 competent prompt engineer，制度上来说是无关的。

这不是系统坏了——它是按设计运行的。

Related Insights

Academic Proof-of-Work失效: LLM使学术"证明工作"系统失效——用AI可以快速产出"证明"，但没有真正学到技能
Steering失效: 模型增大导致activation steering失效，对AI安全是坏消息
持续学习不可能: LLM是imitation learning，无法实现真正的持续学习

Why This Matters

这不是关于AI好或坏的问题。这是关于评估系统衡量的是什么的问题。当我们optimize可测量的输出时，我们失去的是不可测量的能力。

AI可以加速产出。但如果你把过程交给机器，你移除的是实际上有价值的部分——也就是人类智力的发展。