专访Nvidia CEO Jensen Huang:加速计算的过去与未来
Nvidia
Jensen Huang
GTC 2026
加速计算
CPU
代理
背景
这是Ben Thompson与Nvidia CEO Jensen Huang的第五次访谈,发生在GTC 2026主题演讲结束后。
核心主题
1. AI五层蛋糕
Jensen提出了AI的五层架构:
- Power - 电力
- Chips - 芯片
- Infrastructure - 基础设施
- Models - 模型
- Applications - 应用
2. 全栈公司的本质
"从一开始,我们就意识到加速计算是一个全栈问题。你必须理解应用,才能加速它。"
Nvidia不仅做芯片,还构建AI工厂、AI基础设施,涉及冷却管理、电力系统、冗余设计等。
3. CPU的回归
关键洞察:代理时代CPU重新变得重要。Nvidia现在销售CPU(Vera CPU),这不是"加速计算与CPU对立",而是"用最佳工具加速应用"。
CPU设计的历史:过去十年CPU为超大规模云设计,目标是尽可能多的核心来出租。
代理时代的CPU需求:
- SQL/数据库处理 - 结构化工具
- 个人电脑场景 - 非结构化工具(浏览网页、识别按钮等)
4. 推理的重要性
"生成式AI确实是一个大突破,但它会产生幻觉。我们通过推理来'扎根'它。没有推理,你就无法做到这一点。"
推理让AI可以:
- 将问题分解成可执行的部分
- 使用工具
- 验证结果
5. 代码:AI的关键突破
"编程与其他模态不同。你不能一个token一个token地生成代码,你必须反思整块代码。那块代码必须被正确分解、必须是最佳的、必须能编译——它必须扎根于执行,而不是统计上的可能性。"
工程师现在可以使用代理来:
- 描述规格和架构,而非直接写代码
- 用更抽象的方式表达意图
- 提高生产力
6. 混合架构:Transformer + SSM
Nemotron 3使用Transformer + Mamba (SSM)的混合架构,实现"超级智能+超级高效"。
7. 未来的模型架构
- 长记忆:transformer的注意力是二次方的,需要新架构处理长对话
- 几何感知:很多自然是对称的,模型需要物理基础
- 连续vs离散:生成文字是离散的,但生成动作是连续的
关键引用
"AI正在跨越一个重要阈值。模型变得足够好,可以在规模上发挥作用。推理改进了。幻觉大幅下降。扎根大幅改进。首次,基于AI的应用开始产生真正的经济价值。"
"我们所有的软件工程师现在都在使用编码代理。他们中的很多人已经有一段时间没有生成一行代码了,但他们非常高效,非常忙碌。"