AI 的未来是本地?
核心观点
关于数据中心建设热潮是否值得投资的讨论主要集中在两种场景:AI 采用加速 vs AI 采用不及预期。但第三种场景同样可能:开源模型在本地工作站上占据主导地位。
开源模型保持同步
除了 GPT-4,开源模型通常在 frontier model 发布后 6 个月内就能达到同等性能水平。这种"追赶"速度令人印象深刻,表明开源社区有强大的技术复制和优化能力。
作者指出,模型提供商帮助训练了他们的开源竞争对手——前沿模型的开源特性使得知识传播不可避免。
远程提供商价格上涨
前沿模型的单位经济学类似于 Uber 的"廉价乘车时代":
- 尽管 OpenAI 收入达 130 亿美元,但预计 2026 年亏损 140 亿美元
- 其中 80 亿美元是计算成本
- Anthropic 的 Claude Max 订阅估计每月消耗高达 5,000 美元的计算资源
- Claude Code Review 功能定价高达每个 PR $15-$25
小型专业化模型的出现
如果前沿模型价格大幅上涨(每个 PR 审查 $25),需求将转向小型专业化模型。开源社区完全能够满足这一需求。
已有案例表明:通过微调的 GPT-4o-mini 模型可以在 2% 的成本下达到 GPT-4o 的同等性能。
Apple 的本地化赌注
Apple 是唯一不投入大量数据中心资金的科技巨头。他们的策略是:让竞争对手烧钱训练模型,让技术进步传播到开源模型,然后制造足够好的设备来运行这些模型。
最新的 MacBook 5 Pro Max 似乎在本地运行更大模型方面取得了突破。最新的 M5 Max 芯片可以支持高达 134.9B 参数的模型运行。
隐私和免费的吸引力
"如果开源模型能够与托管替代方案达到同等水平,它们就有了一个引人注目的价值主张:快速、私密且免费。"
这种可能性尚未得到太多关注——没有人能从它们身上赚大钱。但对现有领导者的威胁是巨大的。
关键数据
| 模型 | 提供商 | 发布时间 | 开源追平时间 |
|---|---|---|---|
| GPT-3.5 | OpenAI | 2022年11月 | 9个月 (Llama 2 70B) |
| GPT-4 | OpenAI | 2023年3月 | 16个月 (Llama 3.1 405B) |
| Claude 3 Opus | Anthropic | 2024年3月 | 4个月 (Llama 3.1 405B) |
| o1 | OpenAI | 2024年9月 | 4个月 (DeepSeek-R1) |
结论
本地 AI 的未来取决于开源模型的持续进步、硬件能力的提升,以及用户对隐私和成本效益的需求。这不是不可能的场景,而且可能对当前 AI 领导者构成重大威胁。