Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

NEWS 新闻NEWS 新闻
0

摘要: 英伟达近日开源了其人形机器人基础模型GR00T N1,这一举措被视为推动通用人形机器人发展的重要一步。GR00T N1基于大规模数据集训练,能够理解语言和图像指令,执行复杂的任务,并在不同机器人平台上实现通用性。该模型的开源将加速人形机器人在物流、制造、零售、医疗等领域的应用,预示着AI通用机器人时代的加速到来。

正文:

在人工智能领域,人形机器人一直是一个备受关注的研究方向。近日,科技巨头英伟达(NVIDIA)宣布开源其人形机器人基础模型GR00T N1,引发了业界广泛关注。作为全球首个开源的通用人形机器人基础模型,GR00T N1的发布无疑为人形机器人的发展注入了新的活力。

GR00T N1的设计目标是实现通用操作任务的执行。这意味着,它不仅能够完成简单的动作,还能在多样化的环境中执行各种复杂的操作任务,例如抓取、搬运、双臂协调操作等。更为重要的是,GR00T N1能够同时处理语言指令和视觉图像,机器人可以根据自然语言指令执行复杂的操作任务,这大大提升了人机交互的便捷性和效率。

GR00T N1的技术原理主要基于双系统架构。其中,视觉-语言模型(System 2)基于 NVIDIA-Eagle 和 SmolLM-1.7B 构建,负责用视觉和语言指令理解环境,进行推理和规划,输出动作计划。而扩散变换器(System 1)则作为动作模型,将视觉-语言模型的计划转化为精确的连续动作,控制机器人运动。这种双系统架构的设计,使得GR00T N1能够更好地理解人类指令,并将其转化为实际的动作。

为了训练GR00T N1,英伟达采用了大规模的数据策略。预训练数据包括互联网视频数据(提供人类动作模式和任务语义)、合成数据(基于 NVIDIA Omniverse 平台生成,补充运动控制信号)和真实机器人数据(遥操作收集,确保模型适应真实环境)。通过结合互联网规模数据、合成数据和真实机器人数据进行预训练,GR00T N1显著提升了性能和泛化能力,减少了对大规模标注数据的依赖。

GR00T N1的开源,将极大地推动人形机器人在各个领域的应用。在物流与仓储领域,GR00T N1可以用于抓取、搬运和分拣货物,自动盘点库存,优化货物存储和管理。在制造业领域,GR00T N1可以执行零部件的精准装配,进行产品质量检测,提升生产效率和质量控制。在零售行业,GR00T N1可以自动整理货架、补货,为顾客提供信息查询和商品推荐服务,提升购物体验。在医疗保健领域,GR00T N1可以辅助患者进行康复训练,搬运和管理医疗物资,减轻医护人员负担。此外,GR00T N1还可以应用于工业检查与维护,对设备进行巡检,发现异常并报告,执行简单的维护操作,降低人工成本。

英伟达开源GR00T N1,不仅是技术上的突破,更是对整个机器人产业的推动。通过开源,英伟达将GR00T N1的技术分享给全球的开发者和研究者,鼓励他们在此基础上进行创新和改进。这将加速人形机器人的研发进程,推动其在各个领域的应用,最终实现AI通用机器人时代的到来。

结论:

英伟达开源GR00T N1人形机器人基础模型,是人工智能领域的重要里程碑。GR00T N1的技术特点和应用前景,预示着AI通用机器人时代的加速到来。随着技术的不断发展和完善,人形机器人将在未来的社会生活中扮演越来越重要的角色,为人类带来更多的便利和福祉。

参考文献:


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注