专访Nvidia CEO Jensen Huang:加速计算的过去与未来

来源: Stratechery | 作者: Ben Thompson | ⭐⭐⭐⭐⭐ (5星)
Nvidia Jensen Huang GTC 2026 加速计算 CPU 代理

背景

这是Ben Thompson与Nvidia CEO Jensen Huang的第五次访谈,发生在GTC 2026主题演讲结束后。

核心主题

1. AI五层蛋糕

Jensen提出了AI的五层架构:

  • Power - 电力
  • Chips - 芯片
  • Infrastructure - 基础设施
  • Models - 模型
  • Applications - 应用

2. 全栈公司的本质

"从一开始,我们就意识到加速计算是一个全栈问题。你必须理解应用,才能加速它。"

Nvidia不仅做芯片,还构建AI工厂、AI基础设施,涉及冷却管理、电力系统、冗余设计等。

3. CPU的回归

关键洞察:代理时代CPU重新变得重要。Nvidia现在销售CPU(Vera CPU),这不是"加速计算与CPU对立",而是"用最佳工具加速应用"。

CPU设计的历史:过去十年CPU为超大规模云设计,目标是尽可能多的核心来出租。

代理时代的CPU需求:

  • SQL/数据库处理 - 结构化工具
  • 个人电脑场景 - 非结构化工具(浏览网页、识别按钮等)

4. 推理的重要性

"生成式AI确实是一个大突破,但它会产生幻觉。我们通过推理来'扎根'它。没有推理,你就无法做到这一点。"

推理让AI可以:

  • 将问题分解成可执行的部分
  • 使用工具
  • 验证结果

5. 代码:AI的关键突破

"编程与其他模态不同。你不能一个token一个token地生成代码,你必须反思整块代码。那块代码必须被正确分解、必须是最佳的、必须能编译——它必须扎根于执行,而不是统计上的可能性。"

工程师现在可以使用代理来:

  • 描述规格和架构,而非直接写代码
  • 用更抽象的方式表达意图
  • 提高生产力

6. 混合架构:Transformer + SSM

Nemotron 3使用Transformer + Mamba (SSM)的混合架构,实现"超级智能+超级高效"。

7. 未来的模型架构

  • 长记忆:transformer的注意力是二次方的,需要新架构处理长对话
  • 几何感知:很多自然是对称的,模型需要物理基础
  • 连续vs离散:生成文字是离散的,但生成动作是连续的

关键引用

"AI正在跨越一个重要阈值。模型变得足够好,可以在规模上发挥作用。推理改进了。幻觉大幅下降。扎根大幅改进。首次,基于AI的应用开始产生真正的经济价值。"
"我们所有的软件工程师现在都在使用编码代理。他们中的很多人已经有一段时间没有生成一行代码了,但他们非常高效,非常忙碌。"

原文链接 →