Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

在上海浦东滨江公园观赏外滩建筑群-20240824在上海浦东滨江公园观赏外滩建筑群-20240824
0

引言

在人工智能领域,一场激烈的竞赛正在展开。近日,OpenAI 发布的 ChatGPT-4o-Latest 模型在 LMSYS 的聊天机器人竞技场(Chatbot Arena)比赛中以1314分的成绩力压谷歌的 Gemini 1.5 Pro 模型,夺回了冠军宝座。这一成绩的取得,标志着 OpenAI 在 AI 领域的技术实力再次得到了肯定。

比赛背景

LMSYS 的聊天机器人竞技场是由伯克利大学主导团队 LMSYS Org 发起的一个针对大语言模型的基准平台。该平台采用匿名、随机的方式让不同的大模型产品进行对抗评测,基于国际象棋等竞技游戏中广泛使用的埃洛等级分系统,通过用户投票产生。每次比赛,系统会随机选择两个不同的大模型机器人和用户聊天,让用户在匿名的情况下选择哪款大模型产品的表现更好一些。最后,系统根据用户的选择判定大模型产品的积分,以排行榜的形式出现在首页中。

竞赛结果

上周,谷歌发布的实验性 Gemini 1.5 Pro 模型以1297分的成绩夺得第一名。然而,OpenAI 并没有就此罢休。昨日,OpenAI 再次发布了名为 chatgpt-4o-latest 的全新前沿模型,该模型是 GPT-4o 的最新版本,上下文窗口输入最高 128000 个词元(tokens),输出最高 16384 个词元。

在最新的比赛中,OpenAI 的 chatgpt-4o-latest 模型以 1314 分的最高分夺回了竞技场第一名的宝座。得分显示,新版 ChatGPT-4o 在编码、指令遵循和硬提示方面都有显著提高。

技术优势

OpenAI 的 ChatGPT-4o-Latest 模型之所以能够取得如此优异的成绩,主要得益于以下几个方面的技术优势:

  1. 上下文窗口输入更高:ChatGPT-4o-Latest 的上下文窗口输入最高可达 128000 个词元,这使得模型能够更好地理解用户的意图和问题。

  2. 输出更高:ChatGPT-4o-Latest 的输出最高可达 16384 个词元,这使得模型能够提供更加丰富和详细的回答。

  3. 编码、指令遵循和硬提示方面均有提高:新版 ChatGPT-4o 在这些方面的提高,使得模型能够更好地理解用户的指令,并提供更加准确和有针对性的回答。

总结

OpenAI 的 ChatGPT-4o-Latest 模型在 LMSYS 的聊天机器人竞技场比赛中取得优异成绩,再次证明了 OpenAI 在 AI 领域的技术实力。未来,随着 AI 技术的不断发展和完善,我们期待 OpenAI 和其他 AI 公司带来更多创新和突破。


>>> Read more <<<

Views: 8

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注