北京,2024年3月12日——北京人形机器人创新中心(国家地方共建具身智能机器人创新中心)今日在北京隆重发布了全球首个“一脑多能”、“一脑多机”的通用具身智能平台——“慧思开物”。这一平台的发布,标志着具身智能领域在通用软件系统方面取得了重大突破,有望彻底改变当前机器人应用开发模式,推动机器人从单一任务执行向复杂环境下的自主决策与执行能力跃升。
具身智能:机器人发展的下一站
具身智能(Embodied Intelligence)是近年来人工智能领域的研究热点,它强调智能体(如机器人)通过与物理世界的交互,获取知识、学习技能并最终实现智能行为。与传统的基于符号推理或深度学习的智能方法不同,具身智能更加注重智能体与环境的动态耦合,认为智能是身体、环境和认知过程相互作用的涌现结果。
在具身智能的框架下,机器人不再仅仅是执行预设程序的机器,而是能够像人类一样,通过感知环境、理解任务、规划动作并最终完成目标。这种智能模式具有更强的适应性、泛化性和鲁棒性,有望在工业制造、家庭服务、医疗健康等领域发挥重要作用。
然而,具身智能的发展也面临着诸多挑战。其中,通用软件系统的缺失是制约其发展的关键瓶颈之一。传统的机器人应用开发模式往往是针对特定场景和任务进行专项开发,缺乏通用性和可扩展性。这导致机器人开发成本高昂、周期漫长,难以满足日益增长的应用需求。
“慧思开物”:填补通用软件系统空白
为了解决这一难题,北京人形机器人创新中心历时多年,研发了全球首个支持多本体多场景应用的通用具身智能平台“慧思开物”。该平台的发布,旨在为具身智能产业补上通用软件系统这块重要拼图,加速具身智能技术的落地应用。
创新中心总经理熊友军在发布会上表示,当前的具身智能在“智能化”方面仍处于初级阶段,行业亟需一个具备多本体兼容性、多场景适应性和强大泛化能力的通用智能平台。“慧思开物”正是为了满足这一需求而诞生的。
据介绍,“慧思开物”能够实现从任务理解到执行的全流程智能化,具备处理多场景复杂任务的泛化能力。它首次实现了单个软件系统在机械臂、轮式机器人、人形机器人等多构型本体上的兼容,能够适应多样化的应用场景和任务,为具身智能机器人提供强大的感知、决策与执行能力。
“大小脑”架构:快慢有度,提升智能水平
“慧思开物”的核心架构是基于“大小脑”结合的设计理念。它由AI大模型驱动的任务规划具身“大脑”以及数据驱动的端到端技能执行具身“小脑”构成,是支持各类机器人与物理世界交互的开放平台。
具身“大脑”:任务规划与决策中心
具身“大脑”是“慧思开物”的认知中心,负责任务的理解、规划和决策。它具备自然交互、空间感知、意图理解、分层规划和错误反思等能力。
- 自然交互: 具身“大脑”能够理解人类的自然语言指令,并将其转化为机器人可以执行的任务。
- 空间感知: 具身“大脑”能够感知周围环境,建立环境模型,为任务规划提供依据。
- 意图理解: 具身“大脑”能够理解用户的意图,并根据意图调整任务规划。
- 分层规划: 具身“大脑”能够将复杂任务分解为可执行的子任务序列,并按照一定的逻辑顺序执行。
- 错误反思: 具身“大脑”能够监测任务执行过程中的状态,发现错误并进行反思,从而优化任务规划。
具身“小脑”:技能执行与运动控制中心
具身“小脑”是“慧思开物”的执行中心,负责技能的执行和运动的控制。它分为具身操作和具身运控两个子平台。
- 具身操作: 具身操作涵盖元技能库、泛化抓取、技能拆解和错误处理等功能。元技能库包含了各种基本的机器人动作,如抓取、放置、移动等。泛化抓取能够使机器人抓取不同形状和大小的物体。技能拆解能够将复杂任务分解为一系列基本动作。错误处理能够在任务执行过程中发现错误并进行纠正。
- 具身运控: 具身运控负责实现全身控制、双臂协作、稳定行走和移动导航等任务。全身控制能够使机器人协调各个关节的运动。双臂协作能够使机器人同时使用两个手臂完成任务。稳定行走能够使机器人保持平衡并稳定行走。移动导航能够使机器人在环境中自主导航。
“大小脑”协同:形成任务闭环
在“慧思开物”中,具身“大脑”和具身“小脑”协同工作,形成任务闭环。具身“大脑”负责任务规划,然后调用具身“小脑”技能库执行具体动作,并将执行反馈传递给具身“大脑”,从而形成一个完整的任务执行流程。
这种“大小脑”结合的架构,既保证了任务规划的灵活性和智能性,又保证了技能执行的效率和可靠性。
多场景适配:满足多样化应用需求
“慧思开物”内置多场景适配引擎,支持从工业制造到家庭服务等多种场景。结合高效的资源调度与并行计算能力,能够精准满足特定场景下的工作节拍与精度标准,为机器人在复杂场景的应用提供可靠的技术保障。
创新中心首席技术官唐剑在发布会上演示了“慧思开物”在工业分拣、积木搭建、桌面清理和物流打包四个场景的真机操作。通过语音交互、APP直连等多种方式,用户能够与机器人轻松交互,场景任务丰富且执行精度高,机器人动作丝滑流畅。
这些演示充分体现了“慧思开物”平台的通用性与智能化水平。
- 工业分拣: 搭载“慧思开物”的机械臂能够基于语音指令完成工业分拣任务,将不同类型的零件按照指定的要求进行分类和放置。
- 积木搭建: 搭载“慧思开物”的机器人能够根据用户的指令,使用积木搭建出各种形状的物体,如房屋、汽车等。
- 桌面清理: 搭载“慧思开物”的机器人能够清理桌面上的杂物,如纸张、笔等,并将它们放置到指定的位置。
- 物流打包: 搭载“慧思开物”的机器人能够将商品放入包装盒中,并进行封箱和贴标签等操作。
数据驱动:提升智能水平的关键
强大的感知、决策与执行能力离不开高质量具身智能数据的支撑。“慧思开物”依托创新中心构建的具身智能数据全链路解决方案,以及行业首个标准化通用具身智能数据集和Benchmark RoboMIND,实现了对多模态数据的高效利用与精准学习。
具身智能数据全链路解决方案包括数据采集、数据清洗、数据标注、数据增强和数据管理等环节,能够保证数据的质量和可用性。标准化通用具身智能数据集包含了各种场景下的机器人操作数据,可以用于训练和评估具身智能算法。Benchmark RoboMIND是一个用于评估具身智能机器人性能的基准测试平台,可以帮助研究人员比较不同算法的优劣。
通过对这些数据的学习,具身“大脑”和具身“小脑”能够不断提升自身的智能水平,从而更好地完成各种任务。
优必选群脑网络:工业级应用案例
熊友军在发布会上还提到,在“慧思开物”的支持下,优必选在全球范围内首次把群脑网络(BrainNet)用于人形机器人执行整条产线的工业级任务。
群脑网络是一种分布式人工智能系统,它将多个机器人的大脑连接在一起,使它们能够协同工作,共同完成任务。在优必选的工业级应用中,多个人形机器人通过群脑网络连接在一起,共同完成产品装配、质量检测等任务。
这种应用模式可以大大提高生产效率和产品质量。
行业意义与未来展望
“慧思开物”的发布,不仅是北京人形机器人创新中心的一项重要成果,也是整个具身智能领域的一项重大突破。它填补了具身智能领域在通用软件系统方面的空白,为具身智能技术的落地应用奠定了坚实的基础。
业内人士认为,“慧思开物”有望成为具身智能领域的“安卓”系统,推动具身智能技术的普及和应用。
未来,北京人形机器人创新中心将继续加大对“慧思开物”的研发投入,不断提升其性能和功能,并积极推动其在各个领域的应用。同时,创新中心还将积极与其他企业和研究机构合作,共同推动具身智能技术的发展,为人类创造更加美好的未来。
“慧思开物”的发布,标志着具身智能领域进入了一个新的发展阶段。随着技术的不断进步和应用的不断拓展,具身智能将会在未来的社会发展中发挥越来越重要的作用。
Views: 0