Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

上海的陆家嘴
0

技术巨头在 AI 领域的较量再掀高潮

在人工智能领域,OpenAI 与谷歌之间的竞争一直如火如荼。近日,OpenAI 再次发力,发布全新 ChatGPT-4o-latest 模型,成功在 LMSYS 的聊天机器人竞技场(Chatbot Arena)中力压谷歌的 Gemini 1.5 Pro,重夺第一名。

OpenAI 迅速找回场子

上周,谷歌发布了最强 Gemini 1.5 Pro 模型,并在 LMSYS 的聊天机器人竞技场中取得第一名。然而,OpenAI 并未就此罢休,迅速推出了名为 ChatGPT-4o-latest 的全新前沿模型,成功找回场子。

ChatGPT-4o-latest 模型简介

ChatGPT-4o-latest 是 GPT-4o 的最新版本,具备更强大的上下文窗口输入能力,最高可达 128000 个词元(tokens),输出最高 16384 个词元。这一改进使得 ChatGPT-4o-latest 在处理复杂对话和任务时具有更大的优势。

LMSYS 聊天机器人竞技场简介

Chatbot Arena 是由伯克利大学主导团队 LMSYS Org 发布的一个针对大语言模型的基准平台。该平台通过匿名、随机的方式让不同的大模型产品进行对抗评测,基于国际象棋等竞技游戏中广泛使用的埃洛等级分系统,通过用户投票产生排行榜。

ChatGPT-4o-latest 最新成绩

在最新的 ChatGPT-4o-latest 模型发布后,OpenAI 凭借该模型在聊天机器人竞技场中取得了 1314 分的最高分,成功夺回了第一名宝座。与谷歌的 Gemini 1.5 Pro 相比,新版 ChatGPT-4o 在编码、指令遵循和硬提示方面都有显著提高。

以下是 ChatGPT-4o-latest 在各项指标中的成绩:

  • 总成绩:第一名
  • 数学:#1-2
  • 编程:第一名
  • 艰难提示词(Hard Prompts):第一名
  • 指令跟随(Instruction Following):第一名
  • 长提问(Longer Query):第一名
  • Multi-Turn:第一名

总结

OpenAI 与谷歌在人工智能领域的较量愈发激烈,双方都在不断推出更先进、更强大的模型。此次 ChatGPT-4o-latest 模型的发布,不仅成功夺回了聊天机器人竞技场的冠军,也展示了 OpenAI 在 AI 领域的强大实力。

未来,我们期待看到更多 AI 巨头的较量,以及他们在人工智能领域的创新成果。这将有助于推动整个行业的发展,为人类带来更多便利和福祉。


read more

Views: 11

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注