You can't imitation-learn how to continual-learn

4.5★ 优秀

来源: LessWrong (180 points, Curated) | 作者: Steven Byrnes | 日期: 2026-03-16

原始链接: lesswrong.com

核心发现

深度论证为什么LLM无法实现真正的持续学习

主要内容

作者Steven Byrnes提出一个教育学观点:LLM具有人类学习没有的限制。其中核心论点是:LLM本质上只是imitation learning,无法实现真正的持续学习(continual learning)。

关键洞见

对比表格

方式 假设空间
Solomonoff induction模仿学习 所有可计算算法
Transformer模仿学习 所有可能的训练Transformer

核心论点

如果用一个transformer观察deep Q network从随机初始化开始玩Atari Breakout,玩了100万次越来越好,然后冻结权重用作模仿学习者:

作者澄清

作者明确这不是说"LLM很笨"或"LLM不可能扩展到超级智能",而是一个狭窄的教育学观点。

相关研究