Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

新闻报道新闻报道
0

引言: 在人工智能飞速发展的今天,如何让人工智能更好地服务于人类,实现高效的人机协作,成为了一个重要的研究方向。近日,一款名为Collaborative Gym(Co-Gym)的全新框架横空出世,它专注于人机协作,支持人类与AI代理之间的实时交互与协作,为AI的实际应用打开了新的大门。

Collaborative Gym:人机协作的评估新标准

Collaborative Gym(Co-Gym)并非一个简单的AI工具,而是一个专注于人机协作(Human-Agent Collaboration)的评估框架。它由SALT-NLP团队开发,旨在为开发者提供一个平台,用于在受控环境中迭代开发,并在真实场景中部署和评估AI代理的协作效果。

核心功能:突破传统,模拟真实协作场景

Co-Gym的核心功能在于其对异步交互的支持。传统的智能体框架往往要求同步行动,而Co-Gym突破了这一限制,允许人类和AI代理在协作中灵活地发起行动,无需严格按顺序交互。这种异步交互模式更接近真实的人类协作,例如,在团队讨论中,每个人都可以随时发表意见,无需等待轮到自己。

此外,Co-Gym还具备以下关键功能:

  • 任务环境设计: 将每个任务定义为部分可观测马尔可夫决策过程(POMDP),支持公共和私有观测空间。公共部分对所有参与者可见,私有部分仅对所有者可见,类似于人类团队中共享白板和个人笔记的区别。
  • 评估框架: 关注任务完成的结果,更重视协作过程本身。提供了综合评估框架,从协作质量和协作过程两个维度对代理进行评估。
  • 模拟与真实条件: 支持模拟和真实两种实验条件。模拟条件使用预收集的任务实例和模拟人类行为,便于快速迭代开发;真实条件支持与真实人类在实际任务环境中协作。

技术原理:协作驱动,异步交互,实时通知

Co-Gym的技术原理基于以下几个关键点:

  • 协作驱动的环境设计: 借鉴了OpenAI Gym的设计思路,针对人机协作进行了优化。支持在观测空间中定义公共和私有部分,模拟了真实协作场景中共享信息和个人笔记的区别。
  • 异步交互: 支持人类和代理在必要时独立行动,无需等待对方响应。为此,Co-Gym引入了两种协作行为:发送消息(SendTeammateMessage)和等待对方继续(WaitTeammateContinue),采用通知协议实时通知参与者环境的变化。
  • 通知协议: 通过Redis服务器实现通知协议,支持四种事件类型:共享观测更新、私有观测变化、新消息通知以及环境不活动超时通知。这支持代理实时监控环境变化,更好地与人类协作。
  • 任务环境接口(CoEnv): 提供了灵活的任务环境接口,支持开发者轻松添加新的任务环境。开发者只需定义任务描述、动作空间和观测空间即可。

应用场景:从旅行规划到文献综述,潜力无限

Co-Gym的应用场景十分广泛,以下是一些具体的例子:

  • 旅行规划(Travel Planning): 人类与AI代理协作制定详细的旅行行程。代理可以基于搜索和规划能力,人类可以提供偏好和专业知识,共同完成旅行计划。
  • 表格数据分析(Tabular Analysis): 为代理和人类提供了共享工作空间和实时沟通能力,支持高效的协作分析。
  • 文献综述(Related Work): 人类与AI代理协作完成学术文献的整理和分析。代理可以快速检索和筛选相关文献,人类可以提供领域专业知识,共同完成高质量的文献综述。

项目地址:

结论:

Collaborative Gym的出现,标志着人机协作领域迈出了重要一步。它不仅提供了一个强大的评估框架,更重要的是,它为开发者提供了一个平台,可以更加方便地开发和评估人机协作的AI代理。随着Co-Gym的不断发展和完善,我们有理由相信,未来的人工智能将能够更好地服务于人类,实现更加高效、智能的人机协作。

参考文献:

(注:由于缺乏具体的作者信息,参考文献中作者部分以团队名称代替。)


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注