⭐⭐⭐⭐⭐ 5星 2026-03-18

2024 Year in Review: 100 Episodes

来源: latent.space/p/2024-review
发布者: Latent Space (174k+ 订阅者)
内容: 100期播客回顾,AI工程师行业全景分析
核心内容:
  • AI工程师崛起:Gartner将其置于hype curve顶点
  • 市场巨变:OpenAI市场份额从95%降至50-75%
  • 推理时间计算(ITC)崛起
  • 多模态战争、数据战争、GPU竞争

🚀 AI工程师的崛起

"One can be quite successful in this role without ever training anything."
— Andrej Karpathy

swyx在2022年提出的"AI工程师"概念已成为现实:

  • Gartner将AI工程师置于hype curve顶点
  • GitHub在GitHub Models中打出"AI engineers"标语
  • 不需要PhD,只需要会用模型
  • Latent Space增长曲线几乎是AI工程行业的代理指标

📊 市场格局巨变

OpenAI市场份额变迁

  • 2023年12月: GPT占据95%市场份额
  • 2024年中: Claude 3发布 (3月),Claude 3.5 Sonnet (6月)
  • 2024年底: 市场份额急剧转移至Anthropic
  • 现在: OpenAI市场份额降至50-75%

小模型浪潮

  • Gemini Flash发起价格战,低端免费(每天10亿token)
  • Gemini Flash现在占OpenRouter请求的50%
  • "小模型"定义变得复杂:不再是单纯的"便宜"
  • 大实验室做小模型:小模型公司被边缘化

🔬 技术趋势

"Pre training has hit a wall." — Ilya Sutskever

1. 推理时间计算 (ITC) 崛起

从"预训练计算最优"转向"推理时间计算":

  • Sepp Hochreiter (LSTM创造者): "我们在预训练中撞墙了"
  • Jürgen Schmidhuber: "我们遇到了不同类型的墙"
  • John Frankel, Ilya, Noam Brown: 都需要新范式
  • 测试时间扩展/推理时间扩展成为新战场

2. 多模态战争

视频理解、图像生成、语音识别全面竞争

3. GPU竞争

"GPU Rich vs GPU Poor"成为新分界线

4. 合成数据

预训练数据即将耗尽,合成数据成为解决方案

🏆 LMSys ELO 排名变化

  • 2023年: 最高ELO约1200
  • 2024年: 所有模型至少1275
  • 竞争格局: 三驾马车:Gemini、Anthropic、OpenAI
  • XAI (Grok): 因API推出慢被排除在基准之外

🎙️ 100期里程碑

  • 近两年的深度技术对话
  • 4个不同录音棚
  • 覆盖前沿实验室、模型训练、AI代理、编码工具
  • 最受欢迎嘉宾:Andrej Karpathy, Chris Lattner, George Hotz, Simon Willison

💡 核心洞见

  1. AI工程师不是ML工程师: 不需要训练模型,只需要会用模型
  2. 市场从集中走向分散: 从OpenAI一家独大到多极竞争
  3. 推理变得和训练一样重要: 测试时间扩展是新范式
  4. 小模型实用化: 成本效益驱动采用
  5. 基准测试正在过时: 需要新方法评估AI能力
"The measure of success is previously just peer review... but money is a better metric."
— swyx

探索日期: 2026-03-18
来源网站: Latent Space - AI Engineer Newsletter & Podcast
评分: ⭐⭐⭐⭐⭐ (5/5)