Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

旧金山—— 人工智能领域的领头羊 OpenAI 近日发布了一系列全新的工具和 API,旨在简化开发者构建 AI Agents(智能体)的过程。这一举措被业内视为 OpenAI 在推动 AI 技术从“聊天框”走向实际工作流程的关键一步,或将开启“Agent 元年”。

OpenAI 认为,尽管过去一年推出的高级推理、多模态交互等模型能力为 Agent 奠定了基础,但开发者在构建生产级 Agent 时,仍然面临诸多挑战。为了解决这些难题,OpenAI 推出了 Responses API、Web 搜索工具、文件搜索工具、计算机使用工具以及开源的 Agents SDK。

Responses API:化繁为简,构建 Agent 应用的新基础

Responses API 结合了 Chat Completions API 的简洁性和 Assistants API 的工具使用能力,开发者只需调用一次 API,即可利用多种工具和多轮模型交互解决复杂任务。

内置工具:赋予 AI 智能体“感知”和“行动”的能力

  • Web 搜索工具: 支持 GPT-4o 和 GPT-4o-mini 模型获取网络最新信息,并在 SimpleQA 基准测试中分别取得了 90% 和 88% 的亮眼准确率。
  • 文件搜索工具: 支持多种文件格式,优化查询、过滤元数据、自定义排序,帮助开发者从海量文档中迅速找到关键信息。
  • 计算机使用工具: 由 Computer-Using Agent (CUA) 模型提供支持,可捕获模型生成的鼠标和键盘操作,在 OSWorld、WebArena 和 WebVoyager 基准测试中分别取得 38.1%、58.1% 和 87% 的成绩。

Agents SDK:简化多 Agent 工作流程编排

Agents SDK 基于 Swarm 框架升级,提供易于配置的 LLM 与内置工具集成、Agent 间智能交接控制、可配置安全检查以及可视化追踪等功能,适用于客户支持自动化、多步研究、内容生成等多种应用场景。

实际应用案例:AI 智能体正在改变工作方式

OpenAI 在官网列举了一些早期测试用户的应用案例:

  • Hebbia 利用 Web 搜索工具帮助资产管理者和法律从业者从海量数据中提取可行见解。
  • Navan 将文件搜索工具应用于 AI 旅行 Agent 中,为用户提供精准的旅行政策答案。
  • Unify 和 Luminai 使用计算机使用工具自动化复杂操作流程,特别是对缺乏 API 的传统系统。
  • Box 利用 Agents SDK 快速构建和部署了企业数据搜索应用。

在一个演示案例中,OpenAI 展示了一个“个人造型师” Agent 的应用。该 Agent 首先使用文件搜索工具翻看用户服装喜好数据,整理出穿衣风格。然后,结合 Web 搜索工具,基于用户所在位置搜索附近的相关商店,并推荐了东京的 Patagonia 店铺。最后,计算机使用工具自动操作网页界面,为用户买下一件黑色 Patagonia 夹克,整个过程流畅自然。Agent 甚至可以将退货请求无缝交接给客服 Agent,完成退货流程。

定价与未来展望:AI 智能体将成为劳动力的重要组成部分

OpenAI 同时公布了新工具的定价。Web 搜索每千次查询分别为 GPT-4o 搜索 30 美元和 GPT-4o-mini 搜索 25 美元;文件搜索每千次查询 2.5 美元,文件存储 0.1 美元/GB/天(首 GB 免费);计算机使用工具则按每输入百万 token/3 美元和每输出百万 token/12 美元计费。

OpenAI 表示,随着模型能力变得更加具有 Agent 属性,他们会继续深化 API 间的整合,并提供新工具帮助部署、评估和优化生产环境中的 Agent。

英伟达 CEO 黄仁勋曾指出,未来每个公司的 IT 部门将转变为 AI Agent 的“HR 部门”。从管人到管 AI,Agent 将很快成为劳动力的重要组成部分,提高各行业的生产力。

结论:降低技术门槛,加速 AI 智能体落地

OpenAI 此次发布的 Agent 工具包,通过 Responses API 将多种功能整合成一个简单接口,内置工具为 AI 提供了“感知”和“行动”的能力,Agents SDK 则提供了协调多 Agent 的标准框架,极大地简化了开发者构建 AI Agent 的过程,降低了技术门槛。

这或许正是 OpenAI 所说的“Agent 元年”的真正含义——让 AI 不再局限于聊天框,而是能融入现实工作流程,成为你的“数字助理”甚至“数字同事”。

参考文献:

  • APPSO. (2024). 刚刚,OpenAl 发布 Agent 工具包,网友:谢谢 Manus AI. Retrieved from [APPSO URL]

致谢:

感谢 Manus AI 在人工智能领域的贡献,以及所有为推动 AI 技术发展做出努力的开发者和研究人员。

(记者:[你的名字])


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注