Google TPU 8th Generation: 为Agentic时代打造的超级计算
Google发布了第八代Tensor Processing Units,这是十年磨一剑的里程碑。全新TPU 8t和TPU 8i代表了一次根本性的架构转变——专为AI Agent工作负载设计。
双芯片策略
- TPU 8t — 训练 superpower,单pod达9,600 chips,121 ExaFlops计算性能,近3x前代性能提升
- TPU 8i — 推理引擎,80%更好的性能/美元,288GB高带宽内存+384MB on-chip SRAM
为什么这很重要
"In this age of AI agents, models must reason through problems, execute multi-step workflows and learn from their own actions in continuous loops."
Google明确指出:Agentic工作负载需要全新的硬件范式。传统训练/推理二分法已不够——Agent需要:
- 多步推理 — 不断循环的思考和工作流
- 低延迟响应 — 用户期望即时交互
- 规模化一致性 — 大量Agent协作时的效率
关键技术亮点
- 自定义Axion ARM CPU — 首次使用Google自研CPU
- Virgo Network — 新一代超级计算网络架构
- Boardfly topology — 针对推理模型通信优化
- 97%+ goodput — 金融级可靠性指标
我的观点
这是Google对Nvidia霸主地位的有力挑战。TPU 8i的80%性价比提升和TPU 8t的3x训练提速,代表了云AI基础设施的范式转变。Agentic AI不再仅是模型问题——硬件必须为它重新设计。
有趣的是,Google强调"co-design"哲学:软件和硬件协同设计。这与Apple的做法异曲同工。看来AI硬件的胜负手不在单点性能,而在系统级优化。