清华大学开源全球最大双臂机器人扩散模型 RDT:懂调酒、能遛狗,登顶 Hugging Face 具身热榜

机器之心报道

2024 年 10 月 18 日

今天,世界见证了 RDT 大模型的诞生,它就像“小脑”一样,负责控制机器人的运动。无需人类背后操作,RDT 即可指挥机器人双臂并用,完美调出如晚霞般梦幻的鸡尾酒 Malibu Sunset。

和人类调酒师一样,首先,RDT 将冰块稳稳倒入高脚杯中,不撒不漏,一套动作行云流水。倒完冰块后,RDT 先后倒入椰子酒、橙汁、菠萝汁,操作娴熟,顺序不乱,确保口味一致。注入石榴汁,晚霞般绚烂的酒红色在高脚杯中徐徐晕染开来。最后,RDT 发挥空间感,夹起一片柠檬,轻轻卡在有弧度的杯口上,漂亮!同行看后纷纷表示:有了十亿参数的 RDT,智能机器人时代不远矣!去酒吧点 RDT 调酒师,赛博朋克感瞬间拉满。

在领略了 RDT 的强大后,是时候揭开它的神秘面纱了——RDT 的全称是 Robotics Diffusion Transformer,是全球最大的针对双臂机器人操作任务的扩散基础模型,由清华大学人工智能研究院 TSAIL 团队构建。

当前,机器人领域公认的卡脖子问题是“不够智能”。许多模型需要人教几十遍才能完成单个任务,面对没教过的情况则“束手无策”。而 RDT 正是这个“智能困境”的破壁者。

RDT 的突破:

  • 超大规模: RDT 拥有十亿参数,是目前全球最大的针对双臂机器人操作任务的扩散模型,使其能够学习更复杂的操作技能。
  • 通用性强: RDT 不仅可以调酒,还能完成遛狗、叠衣服等各种复杂任务,展现出极强的通用性。
  • 学习效率高: RDT 采用扩散模型,能够快速学习新的任务,无需大量数据训练,大大提升了机器人的学习效率。

RDT 的意义:

RDT 的开源将加速机器人领域的智能化发展,为机器人产业带来新的突破。它将推动机器人从简单的重复性劳动走向更复杂、更智能的任务,为人类社会带来更多便利。

未来展望:

随着 RDT 的不断发展,未来将有更多功能强大的机器人模型出现,为人类社会带来更多惊喜。RDT 的开源也为全球机器人研究者提供了宝贵的资源,将推动机器人领域取得更快的进步。

参考文献:

免责声明:

本文仅供参考,不构成任何投资建议。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注