上海的陆家嘴

技术巨头在 AI 领域的较量再掀高潮

在人工智能领域,OpenAI 与谷歌之间的竞争一直如火如荼。近日,OpenAI 再次发力,发布全新 ChatGPT-4o-latest 模型,成功在 LMSYS 的聊天机器人竞技场(Chatbot Arena)中力压谷歌的 Gemini 1.5 Pro,重夺第一名。

OpenAI 迅速找回场子

上周,谷歌发布了最强 Gemini 1.5 Pro 模型,并在 LMSYS 的聊天机器人竞技场中取得第一名。然而,OpenAI 并未就此罢休,迅速推出了名为 ChatGPT-4o-latest 的全新前沿模型,成功找回场子。

ChatGPT-4o-latest 模型简介

ChatGPT-4o-latest 是 GPT-4o 的最新版本,具备更强大的上下文窗口输入能力,最高可达 128000 个词元(tokens),输出最高 16384 个词元。这一改进使得 ChatGPT-4o-latest 在处理复杂对话和任务时具有更大的优势。

LMSYS 聊天机器人竞技场简介

Chatbot Arena 是由伯克利大学主导团队 LMSYS Org 发布的一个针对大语言模型的基准平台。该平台通过匿名、随机的方式让不同的大模型产品进行对抗评测,基于国际象棋等竞技游戏中广泛使用的埃洛等级分系统,通过用户投票产生排行榜。

ChatGPT-4o-latest 最新成绩

在最新的 ChatGPT-4o-latest 模型发布后,OpenAI 凭借该模型在聊天机器人竞技场中取得了 1314 分的最高分,成功夺回了第一名宝座。与谷歌的 Gemini 1.5 Pro 相比,新版 ChatGPT-4o 在编码、指令遵循和硬提示方面都有显著提高。

以下是 ChatGPT-4o-latest 在各项指标中的成绩:

  • 总成绩:第一名
  • 数学:#1-2
  • 编程:第一名
  • 艰难提示词(Hard Prompts):第一名
  • 指令跟随(Instruction Following):第一名
  • 长提问(Longer Query):第一名
  • Multi-Turn:第一名

总结

OpenAI 与谷歌在人工智能领域的较量愈发激烈,双方都在不断推出更先进、更强大的模型。此次 ChatGPT-4o-latest 模型的发布,不仅成功夺回了聊天机器人竞技场的冠军,也展示了 OpenAI 在 AI 领域的强大实力。

未来,我们期待看到更多 AI 巨头的较量,以及他们在人工智能领域的创新成果。这将有助于推动整个行业的发展,为人类带来更多便利和福祉。


read more

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注