机器人 AI 深度学习 力控制

Why Do Humanoid Robots Still Struggle With the Small Stuff?

来源: Quanta Magazine | ⭐⭐⭐⭐⭐ 5星

核心发现

过去十年,人形机器人取得了巨大进步,但要想广泛普及,可能需要回到基础。研究人员分析了三大突破和关键瓶颈。

关键发现:尽管深度学习、强化学习和多模态 AI 取得了进展,但机器人仍然在简单任务上挣扎。真正的瓶颈是力控制(force control)—— 机器人需要"感受"力,而不仅仅是移动到位置。

三大突破

1. 深度学习 — 运行在快速 GPU 芯片上的神经网络大大提高了计算机视觉和强化学习,使机器人能够以前所未有的速度和复杂性感知和与环境交互。

2. 执行器革命(2016) — 重型液压机构被更小、更有"本体感受"的电动马达取代,赋予腿足机器人动物般的敏捷性。MIT 的 Sangbae Kim 开创的"准直驱执行器"是关键技术。

3. 大语言模型 — 将聊天机器人技术应用于机器人,使其能够自主规划和执行多步骤任务,例如去核苹果或清空洗碗机。

真正的瓶颈:力控制

MIT 的 Pulkit Agrawal 简洁地回答了为什么机器人仍然困难:"要拥有像人类一样的机器人,我认为我们必须掌握物理。"

人形机器人的全部意义在于实现"多用途移动操作"—— 能够移动到几乎任何地方并处理几乎任何事情,同时不伤害任何人。问题是:"如果你想以人类的速度做这些事情,那就是关于控制力。"

力控制原理很简单:想象一个机器人在白板上写字——不弄断马克笔。机器人专家四十多年前就知道如何实现这一点。但经典方法需要对机器人、环境和任务有大量了解才能工作。

为什么台阶和门仍然困难?

Boston Dynamics 的 Scott Kuindersma 说:"没有世界是有用的、仅做位置控制的人形机器人。'力'作为第一公民是绝对必要的。"

Agility Robotics 的 Jonathan Hurst 同意:"从 AI 的角度来看,你不必考虑力控制。你更像是知道你需要一个准直驱电机来接近必要的力调节,然后在模拟中运行(神经网络)一百万次——然后你把它放在机器人上并获得很酷的行为。"

但这些方法并没有明确教授力的物理特性——至少目前还没有。"做智能力控制所需的许多信号在(视频和人类示范)数据中并不存在。"

我们处于什么阶段?

MIT 的 Russ Tedrake 持乐观态度:"如果你看看电磁学,有伏打阶段,你把电极插入青蛙。然后法拉第做了正确的实验,最终麦克斯韦告诉我们统治方程。我认为我们处于伏打阶段。"

总结:"机器人仍然很差,这需要时间。但基础很好。两者都是真的。而且它仍然很难。" — Russ Tedrake

探索时间: 2026-03-17 | 来源: quantamagazine.org/why-do-humanoid-robots-still-struggle-with-the-small-stuff-20260313/