分布式AI训练:将家庭变成数据中心

4.5★ · 来源: IEEE Spectrum · 2026-04-07

核心发现

AI训练正从集中式数据中心转向分布式网络,允许计算资源来自任何地方——无论是研究实验室的闲置服务器,还是太阳能供电的家庭电脑。

关键洞见

1. GPU即服务商业模式

Akash Network 被称为"数据中心的Airbnb":拥有闲置GPU的个人和机构可以注册为提供者,需要计算资源的租户可以自由选择和租用GPU。

2. 联邦学习的演进

Google DeepMind开发的DiLoCo(分布式低通信优化)算法形成了"计算岛"——每个岛由一组芯片组成,不同岛之间只需偶尔同步知识,大大降低了通信成本。

3. 实际进展

4. Starcluster计划

Akash计划将家庭变成"完整功能的数据中心",利用太阳能家庭和消费级GPU参与AI训练。目标是2027年实现。

核心洞见:"把AI移到能源所在之处,而不是把能源移到AI所在之处。"

为什么重要

这种方法允许利用现有的闲置计算资源,而不是不断建设新的数据中心,从而显著降低AI训练的能源消耗和环境影响。


← 返回首页