具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队
引言
OpenAI 被投企业 Physical Intelligence (PI) 的一系列报道,让具身智能大模型引发的机器人时代变革成为全球关注的焦点。而就在中国,一家名为自变量机器人(X Square)的初创公司,正在悄然引领这场变革。他们正在训练的 Great Wall 操作大模型系列的 WALL-A,不仅在技术路线与 PI 不谋而合,更在参数规模上超越了后者,成为了全球最大规模的端到端统一具身大模型。
自变量机器人:开创具身智能新纪元
自变量机器人是国内唯一一家从第一天就选择了端到端统一大模型技术路线的公司。他们认为,只有通过单一的大模型来驱动端到端的机器人 manipulation,才能真正实现机器人领域的「Scaling Law」,即随着模型规模的增长,其性能也会随之提升。
WALL-A 的强大之处在于其通用性和泛化性。它能够处理长序列复杂任务,例如拉拉链、扣扣子、整理衣物等,这些任务对传统机器人来说极具挑战。此外,WALL-A 还能在极少的样本情况下,完成各种物理环境变量、动作模式的泛化和迁移,这使得它能够在自由环境中,不受预设环境和预设物体限制地进行操作。
“大统一”模型:打破传统界限
自变量机器人将 WALL-A 定义为机器人领域的“大统一”模型,因为它实现了端到端的纵向统一和任务的横向统一。从最原始的视频、传感器信号,到最后机器人的速度、位姿、力矩,所有环节都由一个模型完成,中间没有任何切分的步骤。同时,所有任务都放在同一个模型中训练和推理,一个单一的模型即可解决所有问题。
技术挑战与突破
自变量机器人团队在技术上面临着巨大的挑战。他们需要克服传统机器人学习的小模型技术和语言、多模态大模型技术的局限性,并解决数据工程方面的高要求。他们自研了一系列数据采集设备,并建立了数十个模型来支撑数据系统。
“ChatGPT”时刻的到来
自变量机器人团队认为,目前 Great Wall 系列的 WALL-A 类似于“GPT-2”,随着模型的不断迭代,机器人领域的“ChatGPT”时刻可能会在不久后来到。他们正在进行的技术探索,将彻底改变我们对机器人的理解,并将推动机器人技术进入一个全新的时代。
结论
自变量机器人的出现,标志着中国在具身智能领域取得了重大突破。他们的“大统一”模型 WALL-A,不仅在规模上领先全球,更在通用性和泛化性方面展现出惊人的潜力。随着技术的不断发展,我们可以期待,未来机器人将能够像人类一样,在复杂的环境中完成各种任务,为我们的生活带来更多便利和改变。
参考文献
免责声明: 本文内容仅供参考,不构成任何投资建议。
Views: 0