Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

引言:

当人工智能的触角从虚拟世界延伸至物理现实,具身智能(Embodied AI)正成为科技领域最炙手可热的赛道。它不再仅仅是算法的堆砌,而是让AI拥有感知、决策和行动能力,在真实环境中与人类协同工作。在这场技术变革的浪潮中,清华大学和北京大学的科研团队无疑是领航者。近期,以银河通用、灵初智能和星海图为代表的清北系创业公司密集发布研究成果,引发业界广泛关注。这些团队在技术路线和数据策略上的差异,不仅揭示了具身智能发展的多元路径,也预示着未来竞争格局的雏形。本文将深入剖析这三家公司的核心技术、数据策略,并探讨其背后的逻辑与未来趋势。

主体:

仿真为基:银河通用与低成本路线

银河通用,这家成立于2023年初的公司,由前如布科技联合创始人尹方鸣和姚腾洲领衔,并有北京大学助理教授王鹤担任科学家,其核心理念是“低成本仿真”。他们坚信,通过大规模的仿真环境,可以高效地训练出强大的具身智能模型。经过两年的潜心研发,银河通用近期发布了GraspVLA,这是一款专注于抓取任务的视觉语言动作模型(VLA)。

GraspVLA的思路与RoboCasa、RoboGen等项目类似,都是利用海量合成的仿真数据进行模型训练。具体而言,银河通用将预训练的AnyGrasp模型部署到仿真环境中,采集大量的抓取数据,并以此来训练VLA。为了提高模型的泛化能力,他们在仿真过程中加入了各种随机化因素,模拟真实世界的不确定性。

银河通用的策略,体现了在具身智能发展初期,降低成本、快速迭代的思路。通过仿真环境,可以避免在真实机器人上进行昂贵的实验,从而加速模型的训练和优化。然而,仿真数据与真实世界之间存在着“仿真鸿沟”,如何弥合这一鸿沟,是银河通用未来需要面对的挑战。

强化学习加持:灵初智能的泛化之路

灵初智能成立于2024年9月,由前京东机器人总裁王启斌担任CEO,并汇聚了机器人算法专家柴晓杰、李飞飞学生陈源培等人才,其背后有北京大学助理教授杨耀东和梁一韬的学术支持。灵初智能的策略,是在仿真预训练的基础上,引入强化学习和真机数据微调,以实现更强的泛化能力。

灵初智能发布的Psi R0模型,同样是在仿真环境中进行大规模预训练,但与银河通用不同的是,他们在模仿学习中加入了强化学习技术。这意味着,模型不仅学习如何模仿人类的动作,还能通过试错和奖励机制,自主学习更优的策略。此外,灵初智能还利用少量的真机数据进行微调,以弥合仿真数据与真实世界之间的差距。

Psi R0的Demo视频展示了其在复杂任务上的出色表现,例如双手协作的长程泛化打包任务。此外,灵初智能此前的Lego组装演示,也展示了其在灵巧操作方面的突破。这些成果表明,通过强化学习和真机数据微调,即使只用少量数据,也能训练出泛化能力强的具身智能模型。

灵初智能的策略,体现了在具身智能发展中,追求效率和泛化的思路。他们不依赖于海量真实数据,而是通过算法的创新,提高模型的学习效率和泛化能力。这对于那些难以获取大规模真实数据的团队来说,具有重要的借鉴意义。

真机数据至上:星海图的“真实”信仰

与银河通用和灵初智能不同,星海图在数据选择上持完全不同的观点。这家成立于2023年9月的清华系公司,由Momenta前执行董事高继扬担任CEO,并有清华大学助理教授赵行和许华哲的学术支持。星海图坚信,真机数据才是具身智能模型训练的关键,他们认为真机数据的价值远高于互联网数据和仿真数据。

星海图计划在今年发布100万条真机数据,明年发布1000万条真机数据。他们认为,只有通过大规模的真实数据训练,才能让模型真正理解物理世界的复杂性和多样性。然而,大规模真机数据也存在着“diverse不足”的问题,难以涌现泛化。

为了解决这个问题,星海图提出了Real2Sim2Real的后训练策略。他们将真实数据在仿真环境中进行随机化扩充,以提高模型的泛化能力和落地效果。这意味着,仿真数据在星海图的策略中,不再是预训练的主力,而是作为后训练的“强化剂”。

星海图的策略,体现了在具身智能发展中,对真实数据价值的极致追求。他们认为,只有基于真实数据的训练,才能让模型真正理解物理世界的规律,从而实现更强的泛化能力和落地效果。然而,大规模真机数据的获取和标注成本高昂,如何降低成本,提高效率,是星海图未来需要面对的挑战。

技术路线的殊途同归

尽管三家公司在算法和数据选择上存在差异,但它们都采用了仿真和真实数据相结合的方法。只是在预训练和后训练上,侧重不同的数据比例。银河通用侧重仿真预训练,灵初智能侧重仿真预训练加强化学习,星海图侧重真实数据预训练加仿真后训练。

这表明,在具身智能发展的早期,技术路线尚未完全收敛,各家都在积极探索适合自身特点的道路。然而,它们的目标是一致的,都是为了训练出更强大、更泛化的具身智能模型。

清北AI生态的蓬勃发展

除了以上三家公司,清华北大还有许多团队在具身智能领域取得了重要进展。例如,清华星动纪元ERA-42、北大与国地共建的具身智能中心RoboMind、北大与智元合作的OmniManip、清华千寻智能CoPa和Data Scaling Law等研究成果,都为具身智能的发展注入了新的活力。

这些成果表明,清华北大已经形成了强大的AI生态,正在引领具身智能的创新。随着越来越多的科研成果转化为实际应用,我们有理由相信,具身智能的未来将更加光明。

结论:

清北系AI团队在具身智能领域的密集发力,不仅展现了中国在该领域的强大实力,也揭示了具身智能发展的多元路径。银河通用、灵初智能和星海图三家公司,分别代表了仿真、强化学习和真实数据三种不同的技术路线。它们之间的竞争与合作,将加速具身智能技术的成熟和应用。

未来,具身智能的发展将面临诸多挑战,例如如何弥合仿真鸿沟、如何降低真机数据成本、如何提高模型的泛化能力等。但随着技术的不断进步和生态的日益完善,我们有理由相信,具身智能将深刻改变我们的生活和工作方式。

展望:

  1. 数据策略的演变: 未来,随着数据获取成本的降低和数据处理能力的提高,真机数据的重要性将日益凸显。但仿真数据仍然是不可或缺的补充,如何将仿真数据和真实数据有效地结合起来,将是未来研究的重点。
  2. 算法的创新: 强化学习、迁移学习、自监督学习等算法的创新,将进一步提高模型的学习效率和泛化能力。如何将这些算法有效地应用于具身智能领域,将是未来研究的关键。
  3. 硬件的突破: 随着机器人硬件的不断发展,具身智能的应用场景将更加广泛。如何设计出更灵活、更智能的机器人硬件,将是未来研究的重要方向。
  4. 生态的构建: 具身智能的发展需要一个开放、合作的生态系统。政府、高校、企业、研究机构等各方应加强合作,共同推动具身智能技术的进步和应用。

参考文献:

  • 机器之心. (2025, January 21). 清北团队进军具身智能,银河通用、灵初智能、星海图齐发力. https://www.jiqizhixin.com/articles/2025-01-21-11
  • [此处可添加其他相关学术论文、报告和网站链接,以支持文章观点]

(注:由于是模拟新闻报道,部分日期和信息为虚构,请以实际情况为准。)


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注