LeRobot v0.5.0:全维度扩展
TL;DR: 200+ PR 合并,50+ 新贡献者。首个全人形机器人支持、6 个新策略(Pi0-FAST 自回归 VLA、实时分块)、流式视频编码(零等待)、EnvHub 从 Hub 直接加载模拟环境、NVIDIA IsaacLab-Arena 集成、Python 3.12+ & Transformers v5。
硬件:史上最多机器人
🏃 Unitree G1 人形机器人
- 运动:行走、导航、环境移动
- 操作:精细物体操作
- 遥操作:直观远程控制
- 全身控制 (WBC):协调运动和操作
更多硬件支持
- OpenArm & OpenArm Mini:双臂配置
- Earth Rover:首个移动机器人,户外导航
- OMX Robot:可配置夹爪设置
- CAN Bus 马达:RobStride, Damiao 高扭矩执行器
策略:不断增长的模型动物园
🚀 Pi0-FAST:自回归 VLAs
基于 Gemma 300M 的自回归动作专家,生成离散动作 tokens。
⚡ 实时分块 (RTC)
来自 Physical Intelligence 的推理技术,使流匹配策略更具响应性。不再等待完整动作块完成再重新规划。
🧱 Wall-X
基于 Qwen2.5-VL 的新 VLA 策略,结合 Qwen2.5-VL 强视觉语言理解与流匹配动作预测。
🔬 X-VLA
基于 Microsoft Florence-2 的 VLA,为机器人学习提供替代骨干。
📊 SARM
阶段感知奖励建模,解决长时程任务难题。
🧩 PEFT 支持
现在可以使用 LoRA 微调大型 VLA,无需修改核心训练管道。
数据集:更快录制、更快训练
- 流式视频编码:实时编码帧,episode 之间零等待
- 10 倍图像训练加速
- 3 倍编码加速
- 更好的 CPU 利用率
EnvHub:从 Hub 加载环境
直接从 Hugging Face Hub 加载模拟环境,无需本地安装。
NVIDIA IsaacLab-Arena
GPU 加速模拟,大规模并行环境实例用于快速强化学习。
代码库现代化
- Python 3.12+ 最低版本
- Hugging Face Transformers v5
- 第三方策略插件系统
- 远程 Rerun 可视化
社区成就
- ICLR 2026 论文接收
- LeRobot Visualizer 刷新
- LeRobot Annotation Studio