上海 – 在人形机器人领域,一项引人注目的技术突破近日在上海AI Lab诞生。该实验室具身智能中心的研究团队成功研发出一种名为HoST(Humanoid Standing-up Control)的全新控制算法,使人形机器人能够在各种复杂环境中实现自主“起身站立”,并展现出强大的抗干扰能力。
这一成果不仅解决了机器人从坐姿到站姿转换的难题,更为未来人形机器人在家庭、医疗、救援等场景中的广泛应用奠定了坚实基础。
技术细节:从零开始的自主站立
HoST算法的核心在于其不依赖预定义轨迹的强化学习框架。研究人员通过精巧的奖励函数设计与策略优化,克服了站立控制任务中动态性强、对上下半身动态要求高等挑战。
具体而言,HoST算法包含以下关键技术:
- 多重奖励机制: 算法将奖励函数分为任务奖励、风格奖励、约束奖励和后任务奖励四个类别,并采用多评论家技术对每个奖励函数组进行评估,赋予不同权重,从而优化控制策略。
- 辅助力探索策略: 借鉴婴儿学习动作技能的方式,研究团队在训练初期为机器人提供额外的向上辅助力,帮助其更容易地站起,并逐步减小辅助力,最终实现无辅助力下的自主站立。
- 运动约束: 为了避免机器人学习到剧烈的站起策略,研究人员引入了动作缩放系数,隐式地约束关节的最大力矩与速度。同时,采用平滑约束方法(L2C2)来避免站立过程中的行为抖动。
仿真与真实环境验证
为了验证HoST算法的有效性,研究团队进行了大量的仿真和真实环境测试。
在仿真环境中,研究人员设计了平地、平台、斜坡和靠墙四种地形,并对HoST算法及其消融版本进行了比较。结果表明,多评论家、辅助力探索和运动约束均对策略学习有着显著的影响。
在真实环境中,研究人员将控制策略直接部署到Unitree G1机器人上,并在室内外多种场景进行了测试。结果显示,机器人能够在木质平台、草地、平台、斜坡、靠树、石子路等多种地形上成功站起。
鲁棒性测试与未来展望
为了验证HoST算法的鲁棒性,研究人员还在负重、外部冲击力、软质地面障碍物以及随机扭矩丢失等复杂外部干扰条件下进行了测试。结果表明,HoST算法能够有效地应对各种干扰,保持机器人的平衡和稳定。
上海AI Lab的这项突破性研究,为人形机器人的发展开辟了新的道路。随着技术的不断进步,我们有理由相信,未来人形机器人将在更多领域发挥重要作用,为人类的生活带来更多便利。
参考文献:
- 项目主页:https://taohuang13.github.io/humanoid-standingup.github.io/
- 论文地址:https://arxiv.org/abs/2502.08378
关键词: 人形机器人,上海AI Lab,HoST算法,具身智能,强化学习,机器人控制
Views: 0