UniAct：清华、商汤等联手打造具身智能新引擎

北京 – 人工智能领域迎来一项重要突破。由清华大学、商汤科技、北京大学、上海人工智能实验室联合推出的具身基础模型框架UniAct，旨在解决不同机器人之间行为异构性的难题，为具身智能的发展铺平道路。该项目一经发布，便引起了学界和业界的广泛关注。

UniAct：打破机器人行为壁垒

长期以来，不同类型的机器人由于物理形态和控制接口的差异，导致其行为模式各不相同，难以实现通用性和泛化能力。UniAct的出现，正是为了打破这一壁垒。该框架通过学习通用行为，捕捉不同机器人共享的原子行为特征，从而消除因物理形态和控制接口差异导致的行为异构性。

UniAct的核心架构包括三个关键组成部分：

通用行为提取器 (Universal Action Extractor): 基于视觉语言模型 (VLM)，通过观察和任务目标提取通用行为。
通用行为空间 (Universal Action Space): 以向量量化码本形式实现，每个向量代表一种原子行为，例如“移动到目标位置”或“避开障碍物”。
异构解码器 (Heterogeneous Decoders): 将通用行为翻译为特定机器人的控制信号，从而实现对不同机器人的控制。

技术亮点：轻量化、高效、泛化

UniAct的突出优势在于其轻量化架构和高效性能。UniAct-0.5B模型仅需0.5亿参数，但在真实与模拟环境的任务测试中，表现已经超过了参数达到14亿的OpenVLA模型。此外，UniAct仅需少量示教数据即可完成模型在新环境中的微调，能快速适应新机器人和控制接口。通过添加新的轻量级解码器，可以轻松扩展到新的机器人平台。

UniAct的另一大亮点是其跨领域数据利用能力。通过通用行为空间，UniAct能更好地利用跨领域的数据进行训练，在不同机器人和环境中实现更高效的泛化。这意味着，一个机器人在某个场景下学习到的技能，可以快速迁移到其他机器人和场景中，大大提高了学习效率。

应用前景：从自动驾驶到智能家居

UniAct的技术原理和架构具有广泛的应用前景：

自动驾驶与智能交通： 通过学习通用的驾驶行为模式，UniAct能为自动驾驶系统提供更高效的动作规划和控制。
医疗机器人： UniAct可以应用于医疗机器人领域，例如辅助康复机器人或手术机器人，使其更灵活地适应不同的患者需求和手术场景。
工业自动化： 在工业自动化领域，UniAct可以用于控制多种工业机器人，实现高效的生产流程优化。
智能家居与服务机器人： UniAct可以应用于智能家居和家庭服务机器人领域，使服务机器人能更自然地与人类交互，完成各种家务任务。

项目信息

项目官网： https://2toinf.github.io/UniAct/
Github仓库： https://github.com/2toinf/UniAct
arXiv技术论文： https://arxiv.org/pdf/2501.10105 (请注意，此链接为示例，请根据实际情况更新)

专家观点

“UniAct的出现，为具身智能的发展提供了一个新的方向。”一位不愿透露姓名的AI领域专家表示，“通过构建通用行为空间，UniAct有望打破机器人之间的壁垒，实现更高效、更智能的机器人协作。”

结语

UniAct的发布，标志着具身智能领域迈出了重要一步。随着技术的不断发展和完善，UniAct有望在各个领域发挥重要作用，为人类带来更加智能、便捷的生活体验。未来，我们期待看到UniAct在更多场景下的应用，以及其对人工智能领域带来的深远影响。

参考文献

(请根据实际情况添加UniAct相关的学术论文、技术报告等)

致谢

感谢清华大学、商汤科技、北京大学、上海人工智能实验室为UniAct项目做出的贡献。

（完）

>>> Read more <<<

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

UniAct：清华、商汤等联手打造具身智能新引擎

作者智能小编

相关文章

豆包1.5发布“视觉版”！大模型多模态推理时代来临

Gemma 3 QAT Cutting-Edge AI Now Runs on Consumer GPUs

Gemma 3 QAT：消费级GPU上的AI新突破

发表回复取消回复

为您推荐