让机器人拥有“潜意识”:英伟达 1.5M 小模型实现通用控制
引言
想象一个机器人,它不仅能完成指令,还能像人类一样,拥有“潜意识”来协调身体动作,适应各种环境和任务。这不再是科幻小说中的场景,英伟达 GEAR 团队最新发布的 HOVER 模型,就将这一梦想变成了现实。这个仅有 1.5M 参数的小模型,却能实现对人形机器人的通用控制,展现了人工智能在机器人领域的新突破。
HOVER:一个通用型的人形机器人控制器
HOVER 的灵感源自人类的潜意识。我们行走、保持平衡、调整四肢位置,这些动作都依赖于潜意识的计算。HOVER 将这种“潜意识”能力融合进机器人,通过学习协调人形机器人的电机,实现运动和操控。
HOVER 的优势在于其通用性。它可以接收多种高级运动指令,包括头部和手部姿势、全身姿势、全身关节角度、根速度命令等,并将其转换为高频的低级运动信号,控制机器人完成各种动作。
训练过程:模拟“道场”中的密集训练
HOVER 的训练使用了 NVIDIA Isaac,一个 GPU 驱动的模拟套件,可以将物理加速到实时的 1 万倍。这相当于让机器人在一个虚拟“道场”中进行密集训练,只需 50 分钟的 GPU 运算,就能让机器人“学习”到一整年的训练经验。
HOVER 的贡献:
- 统一界面:用户可以使用任何方便的输入设备来控制机器人,如增强现实设备、动作捕捉系统、外骨骼、虚拟现实头设等。
- 简化数据收集:提供了一种更简单的全身远程操作数据收集方法。
- 视觉-语言-动作模型:可用于提供运动指令,HOVER 将其转换为低级运动信号。
技术细节:基于目标的强化学习
HOVER 的训练基于目标的强化学习,其策略的目标是跟踪实时的人类运动。该团队定义了一个统一的命令空间,包含运动位置跟踪、局部关节角度跟踪、根跟踪等多种控制模式,能够适应各种场景和任务。
未来展望:
HOVER 的出现,标志着机器人控制技术迈向了新的里程碑。它将推动人形机器人应用的普及,在医疗、制造、服务等领域发挥更大的作用。未来,随着技术的不断发展,我们可以期待更加智能、灵活、自主的机器人,为人类生活带来更多便利和福祉。
参考文献:
- HOVER: Versatile Neural Whole-Body Controller for Humanoid Robots. https://arxiv.org/pdf/2410.21229
- HOVER 项目地址: https://hover-versatile-humanoid.github.io/
结语
HOVER 的成功,证明了小模型在机器人领域同样具有巨大潜力。它不仅展示了人工智能技术的进步,更展现了人类对机器人的未来愿景:一个拥有“潜意识”,能够理解和适应人类世界的智能伙伴。
Views: 0