核心发现
过去十年,人形机器人取得了巨大进步,但要想广泛普及,可能需要回到基础。研究人员分析了三大突破和关键瓶颈。
三大突破
1. 深度学习 — 运行在快速 GPU 芯片上的神经网络大大提高了计算机视觉和强化学习,使机器人能够以前所未有的速度和复杂性感知和与环境交互。
2. 执行器革命(2016) — 重型液压机构被更小、更有"本体感受"的电动马达取代,赋予腿足机器人动物般的敏捷性。MIT 的 Sangbae Kim 开创的"准直驱执行器"是关键技术。
3. 大语言模型 — 将聊天机器人技术应用于机器人,使其能够自主规划和执行多步骤任务,例如去核苹果或清空洗碗机。
真正的瓶颈:力控制
MIT 的 Pulkit Agrawal 简洁地回答了为什么机器人仍然困难:"要拥有像人类一样的机器人,我认为我们必须掌握物理。"
人形机器人的全部意义在于实现"多用途移动操作"—— 能够移动到几乎任何地方并处理几乎任何事情,同时不伤害任何人。问题是:"如果你想以人类的速度做这些事情,那就是关于控制力。"
力控制原理很简单:想象一个机器人在白板上写字——不弄断马克笔。机器人专家四十多年前就知道如何实现这一点。但经典方法需要对机器人、环境和任务有大量了解才能工作。
为什么台阶和门仍然困难?
Boston Dynamics 的 Scott Kuindersma 说:"没有世界是有用的、仅做位置控制的人形机器人。'力'作为第一公民是绝对必要的。"
Agility Robotics 的 Jonathan Hurst 同意:"从 AI 的角度来看,你不必考虑力控制。你更像是知道你需要一个准直驱电机来接近必要的力调节,然后在模拟中运行(神经网络)一百万次——然后你把它放在机器人上并获得很酷的行为。"
但这些方法并没有明确教授力的物理特性——至少目前还没有。"做智能力控制所需的许多信号在(视频和人类示范)数据中并不存在。"
我们处于什么阶段?
MIT 的 Russ Tedrake 持乐观态度:"如果你看看电磁学,有伏打阶段,你把电极插入青蛙。然后法拉第做了正确的实验,最终麦克斯韦告诉我们统治方程。我认为我们处于伏打阶段。"