旧金山—— 人工智能领域的领头羊 OpenAI 近日发布了一系列全新的工具和 API,旨在简化开发者构建 AI Agents(智能体)的过程。这一举措被业内视为 OpenAI 在推动 AI 技术从“聊天框”走向实际工作流程的关键一步,或将开启“Agent 元年”。
OpenAI 认为,尽管过去一年推出的高级推理、多模态交互等模型能力为 Agent 奠定了基础,但开发者在构建生产级 Agent 时,仍然面临诸多挑战。为了解决这些难题,OpenAI 推出了 Responses API、Web 搜索工具、文件搜索工具、计算机使用工具以及开源的 Agents SDK。
Responses API:化繁为简,构建 Agent 应用的新基础
Responses API 结合了 Chat Completions API 的简洁性和 Assistants API 的工具使用能力,开发者只需调用一次 API,即可利用多种工具和多轮模型交互解决复杂任务。
内置工具:赋予 AI 智能体“感知”和“行动”的能力
- Web 搜索工具: 支持 GPT-4o 和 GPT-4o-mini 模型获取网络最新信息,并在 SimpleQA 基准测试中分别取得了 90% 和 88% 的亮眼准确率。
- 文件搜索工具: 支持多种文件格式,优化查询、过滤元数据、自定义排序,帮助开发者从海量文档中迅速找到关键信息。
- 计算机使用工具: 由 Computer-Using Agent (CUA) 模型提供支持,可捕获模型生成的鼠标和键盘操作,在 OSWorld、WebArena 和 WebVoyager 基准测试中分别取得 38.1%、58.1% 和 87% 的成绩。
Agents SDK:简化多 Agent 工作流程编排
Agents SDK 基于 Swarm 框架升级,提供易于配置的 LLM 与内置工具集成、Agent 间智能交接控制、可配置安全检查以及可视化追踪等功能,适用于客户支持自动化、多步研究、内容生成等多种应用场景。
实际应用案例:AI 智能体正在改变工作方式
OpenAI 在官网列举了一些早期测试用户的应用案例:
- Hebbia 利用 Web 搜索工具帮助资产管理者和法律从业者从海量数据中提取可行见解。
- Navan 将文件搜索工具应用于 AI 旅行 Agent 中,为用户提供精准的旅行政策答案。
- Unify 和 Luminai 使用计算机使用工具自动化复杂操作流程,特别是对缺乏 API 的传统系统。
- Box 利用 Agents SDK 快速构建和部署了企业数据搜索应用。
在一个演示案例中,OpenAI 展示了一个“个人造型师” Agent 的应用。该 Agent 首先使用文件搜索工具翻看用户服装喜好数据,整理出穿衣风格。然后,结合 Web 搜索工具,基于用户所在位置搜索附近的相关商店,并推荐了东京的 Patagonia 店铺。最后,计算机使用工具自动操作网页界面,为用户买下一件黑色 Patagonia 夹克,整个过程流畅自然。Agent 甚至可以将退货请求无缝交接给客服 Agent,完成退货流程。
定价与未来展望:AI 智能体将成为劳动力的重要组成部分
OpenAI 同时公布了新工具的定价。Web 搜索每千次查询分别为 GPT-4o 搜索 30 美元和 GPT-4o-mini 搜索 25 美元;文件搜索每千次查询 2.5 美元,文件存储 0.1 美元/GB/天(首 GB 免费);计算机使用工具则按每输入百万 token/3 美元和每输出百万 token/12 美元计费。
OpenAI 表示,随着模型能力变得更加具有 Agent 属性,他们会继续深化 API 间的整合,并提供新工具帮助部署、评估和优化生产环境中的 Agent。
英伟达 CEO 黄仁勋曾指出,未来每个公司的 IT 部门将转变为 AI Agent 的“HR 部门”。从管人到管 AI,Agent 将很快成为劳动力的重要组成部分,提高各行业的生产力。
结论:降低技术门槛,加速 AI 智能体落地
OpenAI 此次发布的 Agent 工具包,通过 Responses API 将多种功能整合成一个简单接口,内置工具为 AI 提供了“感知”和“行动”的能力,Agents SDK 则提供了协调多 Agent 的标准框架,极大地简化了开发者构建 AI Agent 的过程,降低了技术门槛。
这或许正是 OpenAI 所说的“Agent 元年”的真正含义——让 AI 不再局限于聊天框,而是能融入现实工作流程,成为你的“数字助理”甚至“数字同事”。
参考文献:
- APPSO. (2024). 刚刚,OpenAl 发布 Agent 工具包,网友:谢谢 Manus AI. Retrieved from [APPSO URL]
致谢:
感谢 Manus AI 在人工智能领域的贡献,以及所有为推动 AI 技术发展做出努力的开发者和研究人员。
(记者:[你的名字])
Views: 0