90年代申花出租车司机夜晚在车内看文汇报90年代申花出租车司机夜晚在车内看文汇报

Mistral AI强势升级:开源多模态模型Pixtral Large问世,le Chat全面挑战ChatGPT

引言: 一觉醒来,人工智能领域再次被震动。Mistral AI,这家以其开源大模型而闻名的公司,不仅发布了其超大杯多模态模型Pixtral Large,还对标ChatGPT,对免费聊天机器人le Chat进行了全面升级,将最先进的AI技术以免费测试版的方式开放给全球用户。这标志着开源AI与闭源AI之间的差距正在迅速缩小,也预示着AI技术民主化的进程正在加速。

主体:

1. Pixtral Large:1240亿参数的开源多模态巨兽

Mistral AI推出的Pixtral Large,是一个基于Mistral Large 2构建的1240亿参数多模态模型。它具备顶尖的图像理解能力,能够轻松处理文档、图表和自然图像,同时保留了Mistral Large 2在纯文本理解方面的领先优势。 该模型采用Mistral研究许可证(MRL)用于研究和教育用途,并可根据Mistral商业许可证用于商业目的的实验、测试和生产。

Pixtral Large并非一蹴而就。它前身是2024年夏季发布的Mistral Large 2,以及9月份发布的首个多模态模型Pixtral 12-B。Mistral AI CEO解释了将模型扩展到1240亿参数的初衷:“我们越来越意识到,要创造最佳的AI体验,需要共同设计模型和产品界面。Pixtral在训练时就考虑到了高影响力的前端应用,是一个很好的例子。”

该模型包含一个1230亿参数解码器和一个10亿参数视觉编码器,上下文窗口达到128K,能够处理至少30张高分辨率图像或约300页的书籍,性能与OpenAI的GPT系列模型相当。在MathVista、DocVQA和VQAv2等基准测试中,Pixtral Large均展现出最先进的性能,在MathVista上更是达到了69.4%的准确率,超越了所有其他模型。它在图表解释、文档分析和图像理解等任务上表现出色,能够准确理解并分析复杂的图表和文档,例如计算账单总额、分析训练损失曲线图,甚至根据图片信息识别使用Mistral AI模型的公司。

2. le Chat:全面升级,直面ChatGPT

Pixtral Large的发布,也为le Chat带来了显著提升。le Chat现在能够处理大型复杂的PDF文档和图像,包括图表、表格、文本、公式等,并进行信息提取、总结和语义理解。 此外,le Chat还新增了实时网络搜索和交互式画布功能,进一步增强了其实用性和交互性。 Mistral AI表示,le Chat的大部分用户是学生和专业人士,这些新功能将极大提升他们的学习、研究和工作效率。

3. 开源AI的崛起

Mistral AI的持续更新,引发了整个AI社区的热议。正如一位业内人士所感叹:“六个月前,开源模型和闭源模型之间的差距非常大。现在,最先进的人工智能正在迅速向任何想要使用它的人开放。” Pixtral Large和升级后的le Chat,无疑是开源AI领域的一座里程碑,标志着开源AI正在迅速追赶甚至超越闭源AI。

结论:

Mistral AI的最新进展,不仅展现了其强大的技术实力,更重要的是,它推动了AI技术民主化的进程。Pixtral Large和升级后的le Chat,为研究人员、开发者和普通用户提供了强大的工具,将进一步促进AI技术的应用和发展。未来,我们有理由期待开源AI在更多领域发挥更大的作用,并为社会带来更大的福祉。 然而,开源模型的商业化模式和伦理问题,也需要进一步探讨和规范。

参考文献:

(注:由于无法访问实时网络,文中链接为示例,请自行替换为实际链接。)


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注