ChatGPT-4o-Latest逆袭登顶，力挫谷歌Gemini 1.5 Pro成AI新霸主

作者智能小编

9 月 6, 2024 #ChatGPT, #Gemini, #每日AI快讯

在上海浦东滨江公园观赏外滩建筑群-20240824

引言

在人工智能领域，一场激烈的竞赛正在展开。近日，OpenAI 发布的 ChatGPT-4o-Latest 模型在 LMSYS 的聊天机器人竞技场（Chatbot Arena）比赛中以1314分的成绩力压谷歌的 Gemini 1.5 Pro 模型，夺回了冠军宝座。这一成绩的取得，标志着 OpenAI 在 AI 领域的技术实力再次得到了肯定。

比赛背景

LMSYS 的聊天机器人竞技场是由伯克利大学主导团队 LMSYS Org 发起的一个针对大语言模型的基准平台。该平台采用匿名、随机的方式让不同的大模型产品进行对抗评测，基于国际象棋等竞技游戏中广泛使用的埃洛等级分系统，通过用户投票产生。每次比赛，系统会随机选择两个不同的大模型机器人和用户聊天，让用户在匿名的情况下选择哪款大模型产品的表现更好一些。最后，系统根据用户的选择判定大模型产品的积分，以排行榜的形式出现在首页中。

竞赛结果

上周，谷歌发布的实验性 Gemini 1.5 Pro 模型以1297分的成绩夺得第一名。然而，OpenAI 并没有就此罢休。昨日，OpenAI 再次发布了名为 chatgpt-4o-latest 的全新前沿模型，该模型是 GPT-4o 的最新版本，上下文窗口输入最高 128000 个词元（tokens），输出最高 16384 个词元。

在最新的比赛中，OpenAI 的 chatgpt-4o-latest 模型以 1314 分的最高分夺回了竞技场第一名的宝座。得分显示，新版 ChatGPT-4o 在编码、指令遵循和硬提示方面都有显著提高。

技术优势

OpenAI 的 ChatGPT-4o-Latest 模型之所以能够取得如此优异的成绩，主要得益于以下几个方面的技术优势：

上下文窗口输入更高：ChatGPT-4o-Latest 的上下文窗口输入最高可达 128000 个词元，这使得模型能够更好地理解用户的意图和问题。
输出更高：ChatGPT-4o-Latest 的输出最高可达 16384 个词元，这使得模型能够提供更加丰富和详细的回答。
编码、指令遵循和硬提示方面均有提高：新版 ChatGPT-4o 在这些方面的提高，使得模型能够更好地理解用户的指令，并提供更加准确和有针对性的回答。

总结

OpenAI 的 ChatGPT-4o-Latest 模型在 LMSYS 的聊天机器人竞技场比赛中取得优异成绩，再次证明了 OpenAI 在 AI 领域的技术实力。未来，随着 AI 技术的不断发展和完善，我们期待 OpenAI 和其他 AI 公司带来更多创新和突破。

>>> Read more <<<

智能新闻

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

ChatGPT-4o-Latest逆袭登顶，力挫谷歌Gemini 1.5 Pro成AI新霸主

作者智能小编

引言

比赛背景

竞赛结果

技术优势

总结

相关文章

赫拉利：秩序渴求，AI控人的首要原因

Secure Spring AI MCP Server with OAuth2 Best Practices

Spring AI MCP服务器安全升级：OAuth2保驾护航

发表回复取消回复

为您推荐

赫拉利：秩序渴求，AI控人的首要原因

Secure Spring AI MCP Server with OAuth2 Best Practices

Spring AI MCP服务器安全升级：OAuth2保驾护航

告别文档灌输！RAG入门指南

作者智能小编

引言

比赛背景

竞赛结果

技术优势

总结

相关文章

发表回复 取消回复

为您推荐

发表回复取消回复