云服务的困局与AI时代的新机会
云服务正在经历一场静默的危机。过去十年,我们习惯了把应用部署到AWS、Azure、GCP,习惯了按需付费的弹性,习惯了"云原生"带来的便利。但如果我们仔细审视这一切,会发现一个令人不安的事实:云的根本问题不是技术问题,而是商业模式问题。而AI正在把这些问题放大到难以忽视的程度。
被忽视的成本结构
让我们从最直观的数字说起。
crawshaw.io的一位创业者分享了他构建云服务的真实成本对比:他需要200k IOPS的存储性能,云厂商报价是每月5000美元。而在AWS上获取同等性能的io1磁盘,成本直接飙升到每月10000美元。这不是个例。云厂商的定价逻辑从来不是"成本+合理利润",而是"你能承受多少"。
更典型的例子是网络 egress 费用。当你的应用需要向用户分发数据时,每GB流量都要付费。一个中型应用每月可能有数百美元甚至数千美元的流量账单。这不是技术必需——这是人为设限。
为什么会这样?因为云厂商的商业模式本质是资源垄断+按量计费。他们不关心你的业务是否高效,只关心你用多少资源。CPU利用率50%还是90%?与他们无关。带宽是否冗余?他们只看你实际跑了多少。
抽象层无法解决的问题
面对这些痛点,行业试图用抽象层来补救。Kubernetes就是最典型的例子。
"让Kubernetes变得好用本身就是不可能的,"一位资深工程师评价道,"这就像给猪涂口红——你改变的是表面,不是本质。"
Kubernetes解决的问题是容器编排和部署自动化,但它无法解决一个根本问题:虚拟机的隔离粒度从一开始就是错的。 当你想在一个VM上运行多个服务时,资源争抢、安全隔离、计费精确性等问题层出不穷。K8S能做的只是在错的抽象层上搭建更复杂的编排。
这就像建了一座歪楼,然后在上面装修。装修再精美,也无法改变地基的问题。
AI放大了一切
如果说过去的云问题只是"有点贵",那么AI时代的到来把这个问题变成了"不可承受"。
原因很简单:AI让软件变得更便宜,也就会让软件变得更多。Jevons悖论在AI领域重演——当AI降低了编写软件的门槛,应用的数量会爆发式增长。每个应用都需要存储、计算、网络资源。当数十个AI应用同时运行,按量计费的成本会迅速失控。
更关键的是,AI workload 有独特的资源特征:GPU资源高度稀缺且昂贵,推理请求有明显的波峰波谷,模型加载和卸载的频率远高于传统应用。这些特征恰好撞上了云厂商最擅长的"按峰值定价"模式。
结果是:AI开发者发现,云的成本不再是"优化一下就能降下来"的变量,而是直接决定了产品能否存活。很多AI创业公司在burn rate中最大的单一支出就是云服务费用——甚至超过人力成本。
新的机会在哪里
危机总是伴随机会。云的根本问题在于:它是为传统软件设计的基础设施,而传统软件正在被AI重写。
私有化部署正在变成一个有吸引力的选项。当软件可以在本地硬件上高效运行,当开源工具链足够成熟,企业会重新评估"云优先"是否还是最优解。特别是对于数据敏感的行业,私有部署不仅便宜,还避免了数据泄露的风险。
边缘计算的价值被重新认识。把计算资源放到离用户更近的地方,不仅能降低延迟,还能避开云厂商的网络计费模式。Cloudflare Workers、Fastly Compute 等边缘运行时正在赢得开发者青睐。
开源替代方案在崛起。从自托管的数据库到容器编排,从对象存储到函数计算,开源工具的质量已经接近甚至超越商业方案。唯一缺少的是"一键部署"的体验,而这正是新一批创业公司在解决的问题。
结语
云厂商不是慈善机构,他们的商业模式决定了必然会追求利润最大化。这本身无可厚非。但作为开发者,我们需要清醒地认识到:云不是基础设施的终点,而是特定历史阶段的解决方案。
AI带来的变革不仅是技术层面的,也是经济层面的。当软件的边际成本趋近于零时,云那种"按使用量收费"的商业模式根基正在动摇。一些新的东西正在生长,只是我们还处在黎明之前。
--- 参考来源:crawshaw.io 《I am building a cloud》, 2026-04-23