Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

news pappernews papper
+1

好的,这是一篇根据你提供的信息,并按照你提出的专业新闻写作要求撰写的文章。

标题:从“垃圾”到“报告生成器”:OpenAI o1 模型定位之辩引发行业深思

引言:

“它简直就是垃圾!”这是前 SpaceX 软件工程师、苹果 VisionOS 人机交互设计师 Ben Hylak 在初次使用 OpenAI 的 o1 模型后发出的怒吼。然而,仅仅一天之后,Hylak 的态度发生了戏剧性的转变。这背后,不仅是用户对 AI 模型认知的偏差,更揭示了 AI 技术发展中,模型定位与用户预期之间深刻的矛盾。这篇名为《o1 isn’t a chat model (and that’s the point)》的文章,迅速引发了包括 OpenAI CEO Sam Altman 和总裁 Greg Brockman 在内的广泛关注,其核心观点直指:o1 不是一个聊天模型,而是一个强大的报告生成器。

主体:

1. o1 的“翻车”与用户认知偏差:

2024 年,OpenAI 相继推出了 o1、o1 pro 和 o3 模型,这些模型在推理能力上有了显著提升,但同时也伴随着高昂的订阅费用。然而,许多用户,包括 Hylak 在内,在使用后发现 o1 的表现与预期相去甚远。Hylak 抱怨道,每次向 o1 提问,都需要等待 5 分钟,而得到的答案却常常是自相矛盾的“胡言乱语”,以及未经请求的架构图和优缺点列表。这种体验让 Hylak 深感失望,并直言 o1 就是“垃圾”。

Hylak 的遭遇并非个例,许多用户在尝试将 o1 作为聊天模型使用时,都遇到了类似的问题。他们习惯于与聊天模型进行来回的交互,通过逐步提供上下文来引导模型生成答案。然而,o1 似乎并不擅长这种交互模式,它不会主动向用户索取更多信息,而是直接基于用户提供的有限信息给出答案,这往往导致结果不尽如人意。

2. 从“聊天模型”到“报告生成器”:o1 的重新定位

随着 Hylak 与持不同意见者的交流,他逐渐意识到自己犯了一个根本性的错误:他将 o1 当作聊天模型来使用,而 o1 的设计初衷并非如此。正如文章《o1 isn’t a chat model (and that’s the point)》所指出的,o1 应该被视为一个“报告生成器”。

这一观点得到了 OpenAI 高层的认可。Sam Altman 表示,观察人们对 o1 态度的转变“很有趣”,而 Greg Brockman 则强调,o1 是一种“不同类型的模型”,需要以“一种与标准聊天模型不同的新方式来使用它”。

3. 如何正确使用 o1:上下文为王

如果 o1 不是聊天模型,那么我们应该如何正确使用它呢?关键在于提供尽可能多的上下文。与聊天模型不同,o1 不会主动向用户索取更多信息,它需要用户在初始提示中提供详尽的背景信息。

Hylak 建议,在使用 o1 时,我们应该像对待一个新入职的员工一样,提供详细的背景信息,包括:

  • 详细说明所有尝试过但没有奏效的方法;
  • 添加所有数据库架构的完整 dump;
  • 解释公司的业务、规模以及公司特有的术语。

此外,用户还需要明确指出自己希望得到的输出结果,而不是告诉模型应该如何思考或如何回答。o1 擅长自主推理,一旦获得足够的上下文,它能够自行规划和解决问题的步骤。

4. o1 的优势与局限:

Hylak 在文章中总结了 o1 的优势和局限:

  • 优势:
    • 完美地一次性处理整个/多个文件: o1 能够高效处理大量代码和上下文信息,并一次性完成整个文件或多个文件的处理,且通常不会出错。
    • 减少幻觉: o1 在处理特定领域的查询语言(如 ClickHouse 和 New Relic)时表现出色,能够避免像 Claude 模型那样混淆语法。
    • 医疗诊断: o1 在医疗诊断方面表现出惊人的准确性,能够提供接近正确的鉴别诊断。
    • 解释概念: o1 擅长通过示例解释复杂的概念。
  • 局限:
    • 不擅长交互式对话: o1 不适合作为聊天模型使用,它不会主动向用户索取更多信息。
    • 需要大量的上下文: o1 的性能高度依赖于用户提供的上下文信息,如果上下文不足,其表现可能会令人失望。

结论:

OpenAI o1 模型的定位之争,不仅是一场关于技术应用的讨论,更是一场关于用户认知和技术发展的反思。它提醒我们,AI 模型并非万能,不同的模型有其特定的应用场景和使用方法。用户需要根据模型的特点来调整自己的使用方式,才能发挥其最大的潜力。

o1 的案例也为整个 AI 行业敲响了警钟:在追求技术进步的同时,更需要加强对用户的教育和引导,帮助用户正确理解和使用 AI 模型。未来,随着 AI 技术的不断发展,我们或许会看到更多具有独特功能和定位的模型出现,而如何让用户理解和适应这些模型,将成为行业面临的重要挑战。

参考文献:

(注:以上参考文献使用了 APA 格式)


>>> Read more <<<

Views: 0

+1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注