Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

NEWS 新闻NEWS 新闻
0

好的,请看我为您撰写的这篇新闻报道:

标题:OpenEMMA:多模态自动驾驶新星升起,德州、密歇根、多伦多大学联手开源端到端模型

引言:

在自动驾驶技术日新月异的今天,一个由德州农工大学、密歇根大学和多伦多大学联合开发的开源项目——OpenEMMA,正以其独特的端到端多模态模型框架,吸引着全球研究人员和业界的目光。OpenEMMA的出现,不仅为自动驾驶技术的进步注入了新的活力,也为更安全、更智能的未来出行方式提供了新的可能性。

主体:

1. OpenEMMA:打破传统,实现端到端自动驾驶

传统的自动驾驶系统往往依赖于复杂的模块化设计,需要将感知、决策和控制等环节分别处理,再进行整合。这种模式不仅开发周期长,而且模块之间的衔接也容易出现问题。OpenEMMA则另辟蹊径,采用了端到端的方法,直接从传感器输入学习驾驶动作,无需复杂的符号化接口。这种方法简化了开发流程,提高了系统的整体效率和鲁棒性。

OpenEMMA的核心在于其基于预训练的多模态大型语言模型(MLLMs)。这些模型能够同时处理来自多个传感器的数据,包括前向摄像头图像、文本历史以及车辆状态等。通过将驾驶任务框架化为视觉问答(VQA)问题,OpenEMMA能够更好地理解复杂的驾驶场景,并做出相应的决策。

2. 链式思维推理:赋予模型“思考”的能力

OpenEMMA的另一大亮点是其采用的链式思维推理过程。这种方法指导模型生成关键对象的详细描述、行为洞察以及元驾驶决策。例如,在识别到前方有行人时,模型不仅会识别出“行人”这一对象,还会分析行人的行为意图,并据此做出相应的避让动作。这种“思考”能力,使得OpenEMMA在处理复杂驾驶场景时更加灵活和智能。

此外,为了克服MLLMs在空间推理上的局限,OpenEMMA还集成了一个专门优化的YOLO模型,用于提高3D边界框预测的准确性。这使得模型能够更精确地检测道路上的物体,从而提升整体的感知能力。

3. 技术原理:多模态融合与轨迹规划

OpenEMMA的技术原理主要包括以下几个方面:

  • 预训练的MLLMs: 利用预训练的MLLMs处理复杂的视觉数据,并推理驾驶场景。
  • 链式思维推理: 模型基于链式思维推理生成速度向量和曲率向量,用于计算车辆的未来轨迹。
  • 速度和曲率向量: 模型首先整合每个时间步的航向角,然后计算速度的x和y分量,最终用积分速度分量计算最终轨迹。
  • 对象检测增强: 集成专门优化的YOLO模型,用于3D边界框预测,提高对象检测的准确性。

OpenEMMA遵循基于指令的方法,提示MLLMs产生人类可解释的知识,将轨迹生成任务分解为人类可解释的组成部分,反映驾驶过程。

4. 应用场景:从城市到高速,全方位覆盖

OpenEMMA的应用场景十分广泛,几乎涵盖了所有常见的驾驶场景:

  • 城市道路驾驶: 在复杂的城市交通环境中,处理多变的交通信号、行人、自行车和其他车辆,为自动驾驶车辆提供实时决策和轨迹规划。
  • 高速公路驾驶: 在高速公路上,处理高速行驶中的车辆,进行车道保持、超车、避障等操作的决策支持。
  • 停车和低速驾驶: 在停车场或低速环境中,帮助自动驾驶车辆进行精确的停车操作,避免障碍物,能在狭小空间中导航。
  • 夜间驾驶: OpenEMMA能在低光照条件下工作,提供夜间驾驶时的决策支持,包括对象检测和轨迹规划。
  • 复杂天气条件: 在雨、雾等复杂天气条件下,辅助自动驾驶车辆保持安全行驶,减少天气对驾驶的影响。

5. 开源共享:推动自动驾驶技术进步

OpenEMMA的开源,无疑为自动驾驶领域的研究人员和开发者提供了宝贵的资源。通过开放代码和模型,OpenEMMA不仅促进了更广泛的研究和开发,也加速了自动驾驶技术的进步。

结论:

OpenEMMA的出现,标志着自动驾驶技术在端到端多模态模型方面取得了重要突破。其独特的链式思维推理和多模态数据处理能力,使其在复杂的驾驶场景中表现出色。随着OpenEMMA的不断完善和发展,我们有理由相信,未来的自动驾驶技术将更加安全、智能和可靠。

参考文献:

后记:

作为一名资深新闻记者和编辑,我深知新闻报道的责任和使命。我希望通过这篇报道,不仅能够传递关于OpenEMMA的最新信息,更能够激发读者对自动驾驶技术的思考和讨论。在未来的日子里,我将继续关注科技领域的最新动态,为大家带来更多有深度、有价值的新闻报道。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注