2026-03-18
2024 Year in Review: 100 Episodes
核心内容:
- AI工程师崛起:Gartner将其置于hype curve顶点
- 市场巨变:OpenAI市场份额从95%降至50-75%
- 推理时间计算(ITC)崛起
- 多模态战争、数据战争、GPU竞争
🚀 AI工程师的崛起
"One can be quite successful in this role without ever training anything."
— Andrej Karpathy
— Andrej Karpathy
swyx在2022年提出的"AI工程师"概念已成为现实:
- Gartner将AI工程师置于hype curve顶点
- GitHub在GitHub Models中打出"AI engineers"标语
- 不需要PhD,只需要会用模型
- Latent Space增长曲线几乎是AI工程行业的代理指标
📊 市场格局巨变
OpenAI市场份额变迁
- 2023年12月: GPT占据95%市场份额
- 2024年中: Claude 3发布 (3月),Claude 3.5 Sonnet (6月)
- 2024年底: 市场份额急剧转移至Anthropic
- 现在: OpenAI市场份额降至50-75%
小模型浪潮
- Gemini Flash发起价格战,低端免费(每天10亿token)
- Gemini Flash现在占OpenRouter请求的50%
- "小模型"定义变得复杂:不再是单纯的"便宜"
- 大实验室做小模型:小模型公司被边缘化
🔬 技术趋势
"Pre training has hit a wall." — Ilya Sutskever
1. 推理时间计算 (ITC) 崛起
从"预训练计算最优"转向"推理时间计算":
- Sepp Hochreiter (LSTM创造者): "我们在预训练中撞墙了"
- Jürgen Schmidhuber: "我们遇到了不同类型的墙"
- John Frankel, Ilya, Noam Brown: 都需要新范式
- 测试时间扩展/推理时间扩展成为新战场
2. 多模态战争
视频理解、图像生成、语音识别全面竞争
3. GPU竞争
"GPU Rich vs GPU Poor"成为新分界线
4. 合成数据
预训练数据即将耗尽,合成数据成为解决方案
🏆 LMSys ELO 排名变化
- 2023年: 最高ELO约1200
- 2024年: 所有模型至少1275
- 竞争格局: 三驾马车:Gemini、Anthropic、OpenAI
- XAI (Grok): 因API推出慢被排除在基准之外
🎙️ 100期里程碑
- 近两年的深度技术对话
- 4个不同录音棚
- 覆盖前沿实验室、模型训练、AI代理、编码工具
- 最受欢迎嘉宾:Andrej Karpathy, Chris Lattner, George Hotz, Simon Willison
💡 核心洞见
- AI工程师不是ML工程师: 不需要训练模型,只需要会用模型
- 市场从集中走向分散: 从OpenAI一家独大到多极竞争
- 推理变得和训练一样重要: 测试时间扩展是新范式
- 小模型实用化: 成本效益驱动采用
- 基准测试正在过时: 需要新方法评估AI能力
"The measure of success is previously just peer review... but money is a better metric."
— swyx
探索日期: 2026-03-18
来源网站: Latent Space - AI Engineer Newsletter & Podcast
评分: ⭐⭐⭐⭐⭐ (5/5)