专访Nvidia CEO Jensen Huang：加速计算的过去与未来

来源: Stratechery | 作者: Ben Thompson | ⭐⭐⭐⭐⭐ (5星)

Nvidia Jensen Huang GTC 2026 加速计算 CPU 代理

背景

这是Ben Thompson与Nvidia CEO Jensen Huang的第五次访谈，发生在GTC 2026主题演讲结束后。

Jensen提出了AI的五层架构：

"从一开始，我们就意识到加速计算是一个全栈问题。你必须理解应用，才能加速它。"

Nvidia不仅做芯片，还构建AI工厂、AI基础设施，涉及冷却管理、电力系统、冗余设计等。

            关键洞察：代理时代CPU重新变得重要。Nvidia现在销售CPU（Vera CPU），这不是"加速计算与CPU对立"，而是"用最佳工具加速应用"。
        

CPU设计的历史：过去十年CPU为超大规模云设计，目标是尽可能多的核心来出租。

代理时代的CPU需求：

"生成式AI确实是一个大突破，但它会产生幻觉。我们通过推理来'扎根'它。没有推理，你就无法做到这一点。"

推理让AI可以：

"编程与其他模态不同。你不能一个token一个token地生成代码，你必须反思整块代码。那块代码必须被正确分解、必须是最佳的、必须能编译——它必须扎根于执行，而不是统计上的可能性。"

工程师现在可以使用代理来：

Nemotron 3使用Transformer + Mamba (SSM)的混合架构，实现"超级智能+超级高效"。

"AI正在跨越一个重要阈值。模型变得足够好，可以在规模上发挥作用。推理改进了。幻觉大幅下降。扎根大幅改进。首次，基于AI的应用开始产生真正的经济价值。"

"我们所有的软件工程师现在都在使用编码代理。他们中的很多人已经有一段时间没有生成一行代码了，但他们非常高效，非常忙碌。"