Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

川普在美国宾州巴特勒的一次演讲中遇刺_20240714川普在美国宾州巴特勒的一次演讲中遇刺_20240714
0

微软联合港大推出AgentGen:AI大模型规划能力新突破

香港–(2024年8月29日)微软与香港大学近日联合发布了名为AgentGen的AI项目框架,旨在通过自动生成多样化环境和任务,显著提升大语言模型(LLM)的规划能力。该框架利用名为BI-EVOL的创新方法,创建难度递增的任务集,使8B参数的Llama-3模型在某些任务上接近GPT-4水平。

AgentGen的出现,标志着AI大模型在规划能力方面取得了重要突破。传统的AI模型在面对复杂规划任务时,往往需要大量训练数据和人工干预,而AgentGen则通过自动生成环境和任务,有效地减少了对训练数据的依赖,并提升了模型的自主学习能力。

AgentGen的主要功能包括:

  • 自适应环境构建:框架能够自主构思并创造出多样化的虚拟环境,为智能体提供丰富的交互场景。
  • 智能任务定制:基于先进的语言模型,AgentGen能智能地定制任务,生成的环境能够具有适应性。
  • 动态难度调节:通过创新的BI-EVOL策略,框架能够动态调整任务难度,促进智能体在不同复杂度的任务中学习和成长。
  • 无需大量训练数据:AgentGen的零样本生成能力减少了对大规模训练数据集的需求,加快了模型的训练过程。
  • 精准技能强化:通过指令微调,框架能够精准地强化智能体在特定任务上的技能,提升其解决问题的能力。
  • 全面性能监测:AgentGen通过细致的性能评估体系,智能体能在各种任务中的表现达到最优。

AgentGen的技术原理主要包括:

  • 环境生成:使用大语言模型(LLM)来生成环境规范,包括状态空间、动作空间和转移函数的定义。然后,通过代码生成技术实现这些环境的具体代码。
  • 启发式规则和语料库:在环境生成过程中,AgentGen利用启发式规则和多样化的语料库来指导LLM生成具有多样性的环境。
  • 任务生成:基于生成的环境,AgentGen进一步使用LLM生成相应的规划任务,确保任务与环境相匹配。
  • BI-EVOL方法:采用双向演化(BI-EVOL)方法来调整任务难度,包括easy-evol(简化任务)和hard-evol(复杂化任务),形成难度递增的任务集。
  • 零样本学习:在任务生成的初始阶段,AgentGen通过零样本学习的方式提示LLM生成一组初始规划任务。
  • 指令微调:通过指令微调技术,使用合成的轨迹数据(动作-观察对序列)对LLM进行微调,提升其规划能力。
  • 性能评估:通过成功率和进度率等指标来评估模型在规划任务上的表现,确保训练的有效性。

AgentGen的应用场景十分广泛,包括:

  • 机器人控制:在自动化和智能制造领域,AgentGen可以用于提高机器人的自主规划和决策能力,使其能够更有效地执行复杂的任务。
  • 智能家居系统:AgentGen可以集成到智能家居系统中,帮助系统根据用户的行为和偏好自动调整设备设置,提高居住舒适度和能效。
  • 个人助理:作为个人助理,AgentGen可以帮助用户进行日程安排、任务规划和提醒,提高生活和工作效率。
  • 交通规划:AgentGen可以用于交通系统的优化,帮助规划更合理的行车路线,减少拥堵,提高出行效率。
  • 游戏AI:在电子游戏开发中,AgentGen可以用于生成更智能的非玩家角色(NPC),提供更丰富的游戏体验。

AgentGen的发布,标志着AI大模型在规划能力方面取得了重大进展,为未来AI在更复杂场景中的应用奠定了坚实的基础。相信随着技术的不断发展,AgentGen将会在更多领域发挥重要作用,为人类社会带来更大的益处。

项目地址:

  • GitHub仓库:https://github.com/soarllm/agentgen
  • arXiv技术论文:https://arxiv.org/pdf/2408.00764


read more

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注