引言:
当人工智能的触角从虚拟世界延伸至物理现实,具身智能(Embodied AI)正成为科技领域最炙手可热的赛道。它不再仅仅是算法的堆砌,而是让AI拥有感知、决策和行动能力,在真实环境中与人类协同工作。在这场技术变革的浪潮中,清华大学和北京大学的科研团队无疑是领航者。近期,以银河通用、灵初智能和星海图为代表的清北系创业公司密集发布研究成果,引发业界广泛关注。这些团队在技术路线和数据策略上的差异,不仅揭示了具身智能发展的多元路径,也预示着未来竞争格局的雏形。本文将深入剖析这三家公司的核心技术、数据策略,并探讨其背后的逻辑与未来趋势。
主体:
仿真为基:银河通用与低成本路线
银河通用,这家成立于2023年初的公司,由前如布科技联合创始人尹方鸣和姚腾洲领衔,并有北京大学助理教授王鹤担任科学家,其核心理念是“低成本仿真”。他们坚信,通过大规模的仿真环境,可以高效地训练出强大的具身智能模型。经过两年的潜心研发,银河通用近期发布了GraspVLA,这是一款专注于抓取任务的视觉语言动作模型(VLA)。
GraspVLA的思路与RoboCasa、RoboGen等项目类似,都是利用海量合成的仿真数据进行模型训练。具体而言,银河通用将预训练的AnyGrasp模型部署到仿真环境中,采集大量的抓取数据,并以此来训练VLA。为了提高模型的泛化能力,他们在仿真过程中加入了各种随机化因素,模拟真实世界的不确定性。
银河通用的策略,体现了在具身智能发展初期,降低成本、快速迭代的思路。通过仿真环境,可以避免在真实机器人上进行昂贵的实验,从而加速模型的训练和优化。然而,仿真数据与真实世界之间存在着“仿真鸿沟”,如何弥合这一鸿沟,是银河通用未来需要面对的挑战。
强化学习加持:灵初智能的泛化之路
灵初智能成立于2024年9月,由前京东机器人总裁王启斌担任CEO,并汇聚了机器人算法专家柴晓杰、李飞飞学生陈源培等人才,其背后有北京大学助理教授杨耀东和梁一韬的学术支持。灵初智能的策略,是在仿真预训练的基础上,引入强化学习和真机数据微调,以实现更强的泛化能力。
灵初智能发布的Psi R0模型,同样是在仿真环境中进行大规模预训练,但与银河通用不同的是,他们在模仿学习中加入了强化学习技术。这意味着,模型不仅学习如何模仿人类的动作,还能通过试错和奖励机制,自主学习更优的策略。此外,灵初智能还利用少量的真机数据进行微调,以弥合仿真数据与真实世界之间的差距。
Psi R0的Demo视频展示了其在复杂任务上的出色表现,例如双手协作的长程泛化打包任务。此外,灵初智能此前的Lego组装演示,也展示了其在灵巧操作方面的突破。这些成果表明,通过强化学习和真机数据微调,即使只用少量数据,也能训练出泛化能力强的具身智能模型。
灵初智能的策略,体现了在具身智能发展中,追求效率和泛化的思路。他们不依赖于海量真实数据,而是通过算法的创新,提高模型的学习效率和泛化能力。这对于那些难以获取大规模真实数据的团队来说,具有重要的借鉴意义。
真机数据至上:星海图的“真实”信仰
与银河通用和灵初智能不同,星海图在数据选择上持完全不同的观点。这家成立于2023年9月的清华系公司,由Momenta前执行董事高继扬担任CEO,并有清华大学助理教授赵行和许华哲的学术支持。星海图坚信,真机数据才是具身智能模型训练的关键,他们认为真机数据的价值远高于互联网数据和仿真数据。
星海图计划在今年发布100万条真机数据,明年发布1000万条真机数据。他们认为,只有通过大规模的真实数据训练,才能让模型真正理解物理世界的复杂性和多样性。然而,大规模真机数据也存在着“diverse不足”的问题,难以涌现泛化。
为了解决这个问题,星海图提出了Real2Sim2Real的后训练策略。他们将真实数据在仿真环境中进行随机化扩充,以提高模型的泛化能力和落地效果。这意味着,仿真数据在星海图的策略中,不再是预训练的主力,而是作为后训练的“强化剂”。
星海图的策略,体现了在具身智能发展中,对真实数据价值的极致追求。他们认为,只有基于真实数据的训练,才能让模型真正理解物理世界的规律,从而实现更强的泛化能力和落地效果。然而,大规模真机数据的获取和标注成本高昂,如何降低成本,提高效率,是星海图未来需要面对的挑战。
技术路线的殊途同归
尽管三家公司在算法和数据选择上存在差异,但它们都采用了仿真和真实数据相结合的方法。只是在预训练和后训练上,侧重不同的数据比例。银河通用侧重仿真预训练,灵初智能侧重仿真预训练加强化学习,星海图侧重真实数据预训练加仿真后训练。
这表明,在具身智能发展的早期,技术路线尚未完全收敛,各家都在积极探索适合自身特点的道路。然而,它们的目标是一致的,都是为了训练出更强大、更泛化的具身智能模型。
清北AI生态的蓬勃发展
除了以上三家公司,清华北大还有许多团队在具身智能领域取得了重要进展。例如,清华星动纪元ERA-42、北大与国地共建的具身智能中心RoboMind、北大与智元合作的OmniManip、清华千寻智能CoPa和Data Scaling Law等研究成果,都为具身智能的发展注入了新的活力。
这些成果表明,清华北大已经形成了强大的AI生态,正在引领具身智能的创新。随着越来越多的科研成果转化为实际应用,我们有理由相信,具身智能的未来将更加光明。
结论:
清北系AI团队在具身智能领域的密集发力,不仅展现了中国在该领域的强大实力,也揭示了具身智能发展的多元路径。银河通用、灵初智能和星海图三家公司,分别代表了仿真、强化学习和真实数据三种不同的技术路线。它们之间的竞争与合作,将加速具身智能技术的成熟和应用。
未来,具身智能的发展将面临诸多挑战,例如如何弥合仿真鸿沟、如何降低真机数据成本、如何提高模型的泛化能力等。但随着技术的不断进步和生态的日益完善,我们有理由相信,具身智能将深刻改变我们的生活和工作方式。
展望:
- 数据策略的演变: 未来,随着数据获取成本的降低和数据处理能力的提高,真机数据的重要性将日益凸显。但仿真数据仍然是不可或缺的补充,如何将仿真数据和真实数据有效地结合起来,将是未来研究的重点。
- 算法的创新: 强化学习、迁移学习、自监督学习等算法的创新,将进一步提高模型的学习效率和泛化能力。如何将这些算法有效地应用于具身智能领域,将是未来研究的关键。
- 硬件的突破: 随着机器人硬件的不断发展,具身智能的应用场景将更加广泛。如何设计出更灵活、更智能的机器人硬件,将是未来研究的重要方向。
- 生态的构建: 具身智能的发展需要一个开放、合作的生态系统。政府、高校、企业、研究机构等各方应加强合作,共同推动具身智能技术的进步和应用。
参考文献:
- 机器之心. (2025, January 21). 清北团队进军具身智能,银河通用、灵初智能、星海图齐发力. https://www.jiqizhixin.com/articles/2025-01-21-11
- [此处可添加其他相关学术论文、报告和网站链接,以支持文章观点]
(注:由于是模拟新闻报道,部分日期和信息为虚构,请以实际情况为准。)
Views: 0