Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

shanghaishanghai
0

旧金山 — 在 OpenAI 推出 Deep Research 功能后不到 24 小时,Hugging Face 的五位工程师,包括联合创始人兼首席科学家 Thomas Wolf,迅速行动,打造出 Deep Research 的免费开源版本,名为 Open Deep Research。这一举动不仅展示了开源社区的强大力量,也引发了关于人工智能发展方向的讨论。

OpenAI 近期推出的 Deep Research 功能,允许 ChatGPT Pro 用户每月支付 200 美元,即可享受其强大的信息搜集和分析能力。然而,Hugging Face 团队认为,Deep Research 背后的代理框架信息不够透明,因此决定发起一项 24 小时的“克隆”任务,旨在重现 OpenAI 的成果,并开源所需的框架。

24 小时极限挑战:从架构到功能

Hugging Face 团队公开了 Open Deep Research 的完整开发过程,展现了他们在极短时间内取得的惊人进展:

  • 凌晨 2 点: 设计出基础架构
  • 早上 7 点: 接入 o1 模型
  • 下午 3 点: 实现网页自主滚动技术
  • 晚上 9 点: 完成文件动态解析模块

Open Deep Research 的核心在于为现有 AI 模型添加一套“智能体”框架,使其能够执行多步骤任务,例如在收集信息的同时构建报告并最终展示给用户。该系统由 OpenAI 的 o1 模型和一个开源“代理框架”组成,后者可帮助模型规划分析并指导其使用搜索引擎等工具。

代码智能体:效率提升的关键

Hugging Face 团队对传统人工智能智能体系统进行了改进,采用了所谓的“代码智能体”。 这种方法让智能体用代码表达其行动,从而更有效地处理复杂的动作序列。据称,使用代码智能体而非基于 JSON 的智能体,任务完成效率提高了 30%。

在工具集方面,Open Deep Research 借鉴了他人的工作成果,大大缩短了开发时长。例如,他们使用了基于文本的网络浏览器和用于读取多种文本文件格式的简易文本检查器,这些工具取自微软研究院的 Magentic-One 智能体。

模型选择:o1 胜出,未来可期

在 AI 模型选择方面,Hugging Face 团队尝试了多种大模型,包括 DeepSeek R1 和 o3-mini。最终,他们发现 OpenAI 的 o1 模型在当前用例中效果最佳。不过,该团队表示,随着后续启动 open-R1 计划,他们也会考虑用更好的开放模型取代 o1。

尽管 o3-mini 速度很快,但表现不如 o1 和 gpt-4o。而 DeepSeek R1 的表现不佳,并非因为模型“笨”,而是因为对框架指南的适配不足。Hugging Face 团队正在考虑通过微调来解决这个问题。

性能对比:仍有提升空间

在通用人工智能助手的基准测试 GAIA 上,Open Deep Research 获得了 54% 的准确率分数,而 OpenAI 的 Deep Research 得分是 67.36%。这表明 Open Deep Research 仍有提升空间。

Hugging Face 团队计划通过增加可读取的文件格式数量、提出对文件更精细的处理方式以及用基于视觉的浏览器替代现有浏览器等方式来提升工具性能。此外,他们还计划打造图形用户界面(GUI)智能体,也就是“能查看用户的屏幕,并能直接通过鼠标和键盘进行操作的智能体”。

开源的意义:推动 AI 民主化

Open Deep Research 的开源,无疑将推动人工智能的民主化。通过开放源代码,Hugging Face 团队鼓励更多人参与到 AI 智能体的开发和改进中来。

Hugging Face 团队负责人 Aymeric Roucher 表示:“我们没有选择开放模型,因为研究发现封闭模型的效果更好。但我们会公开整个开发过程并展示代码。大家可以随意切换至任意其他模型,它支持完全开源的流程。”

Open Deep Research 项目的开源地址为:https://github.com/huggingface/smolagents/tree/main/examples/opendeepresearch

参考文献

  • InfoQ 整理 |华卫、核子可乐. (2024, February 7). 等不到 OpenAI 开源了!5 个工程师 24 小时手撸免费版 Deep Research,效果直追正主、过程全公开. Retrieved from [原文链接] (请在此处插入原文链接)

(注:由于未提供原文链接,请自行补充。)


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注