Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

NEWS 新闻NEWS 新闻
0

北京 – 人工智能领域迎来一项重要突破。由清华大学、商汤科技、北京大学、上海人工智能实验室联合推出的具身基础模型框架UniAct,旨在解决不同机器人之间行为异构性的难题,为具身智能的发展铺平道路。该项目一经发布,便引起了学界和业界的广泛关注。

UniAct:打破机器人行为壁垒

长期以来,不同类型的机器人由于物理形态和控制接口的差异,导致其行为模式各不相同,难以实现通用性和泛化能力。UniAct的出现,正是为了打破这一壁垒。该框架通过学习通用行为,捕捉不同机器人共享的原子行为特征,从而消除因物理形态和控制接口差异导致的行为异构性。

UniAct的核心架构包括三个关键组成部分:

  • 通用行为提取器 (Universal Action Extractor): 基于视觉语言模型 (VLM),通过观察和任务目标提取通用行为。
  • 通用行为空间 (Universal Action Space): 以向量量化码本形式实现,每个向量代表一种原子行为,例如“移动到目标位置”或“避开障碍物”。
  • 异构解码器 (Heterogeneous Decoders): 将通用行为翻译为特定机器人的控制信号,从而实现对不同机器人的控制。

技术亮点:轻量化、高效、泛化

UniAct的突出优势在于其轻量化架构和高效性能。UniAct-0.5B模型仅需0.5亿参数,但在真实与模拟环境的任务测试中,表现已经超过了参数达到14亿的OpenVLA模型。此外,UniAct仅需少量示教数据即可完成模型在新环境中的微调,能快速适应新机器人和控制接口。通过添加新的轻量级解码器,可以轻松扩展到新的机器人平台。

UniAct的另一大亮点是其跨领域数据利用能力。通过通用行为空间,UniAct能更好地利用跨领域的数据进行训练,在不同机器人和环境中实现更高效的泛化。这意味着,一个机器人在某个场景下学习到的技能,可以快速迁移到其他机器人和场景中,大大提高了学习效率。

应用前景:从自动驾驶到智能家居

UniAct的技术原理和架构具有广泛的应用前景:

  • 自动驾驶与智能交通: 通过学习通用的驾驶行为模式,UniAct能为自动驾驶系统提供更高效的动作规划和控制。
  • 医疗机器人: UniAct可以应用于医疗机器人领域,例如辅助康复机器人或手术机器人,使其更灵活地适应不同的患者需求和手术场景。
  • 工业自动化: 在工业自动化领域,UniAct可以用于控制多种工业机器人,实现高效的生产流程优化。
  • 智能家居与服务机器人: UniAct可以应用于智能家居和家庭服务机器人领域,使服务机器人能更自然地与人类交互,完成各种家务任务。

项目信息

专家观点

“UniAct的出现,为具身智能的发展提供了一个新的方向。”一位不愿透露姓名的AI领域专家表示,“通过构建通用行为空间,UniAct有望打破机器人之间的壁垒,实现更高效、更智能的机器人协作。”

结语

UniAct的发布,标志着具身智能领域迈出了重要一步。随着技术的不断发展和完善,UniAct有望在各个领域发挥重要作用,为人类带来更加智能、便捷的生活体验。未来,我们期待看到UniAct在更多场景下的应用,以及其对人工智能领域带来的深远影响。

参考文献

  • (请根据实际情况添加UniAct相关的学术论文、技术报告等)

致谢

感谢清华大学、商汤科技、北京大学、上海人工智能实验室为UniAct项目做出的贡献。

(完)


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注