根据您提供的信息,以下是关于360AI助手推出的「模型竞技场」功能的概要:
新闻标题:
360AI助手推出「模型竞技场」功能,多种大模型之间对比测评
新闻正文:
近日,360AI助手推出了全新的「模型竞技场」功能,允许用户在多种大模型之间进行对比测评。据360官方消息,该功能旨在为用户提供一个直观的平台,通过比较不同大模型的性能指标,帮助用户选择最适合自己需求的大模型。
该功能支持显示大模型性能的详细数据,包括「模型响应速度」、「模型生成内容字数」、「模型完成生成内容任务耗时」以及「模型生成内容效率」(每秒钟生成多少字)。用户可以通过这些性能指标,直观地看到不同大模型之间的性能差异。
以下是「模型竞技场」功能的几个主要特点:
- 支持调用最多三个大模型进行对比测评,最低可选两个。
- 用户可以自定义提问,也可以选择预设的题库来提问。
- 显示各大模型的性能详细数据,并提供追问功能。
- 用户可以评价大模型生成内容的质量,并根据反馈替换或添加参与对比的大模型。
- 支持创建新话题、移除全部参与对比的大模型以及查找历史记录等功能。
此外,360AI助手还与多家国内主流厂商的大模型产品开展合作,包括豆包大模型、文心一言大模型、讯飞星火大模型等,用户可以在统一的界面一站式使用这些大模型。
360AI助手通过集结15家国内主流大模型,打造了一个混合模型,实现了整体测评成绩超越GPT-4o的结果。用户可以根据自己的需求自由选择和交叉验证,选择效果最好、最强的大模型。
该功能的推出,不仅丰富了360AI助手的使用体验,也有助于推动各行业的数字化转型和智能化发展。
来源: 360社区
备注: 本新闻概要基于您提供的信息编写,具体细节可能需要进一步核实。
Views: 0