Mistral AI再放大招：Pixtral多模态模型来袭或：Mistral AI：Pixtral多模态模型发布或：挑战Ch

Mistral AI强势升级：开源多模态模型Pixtral Large问世，le Chat全面挑战ChatGPT

引言： 一觉醒来，人工智能领域再次被震动。Mistral AI，这家以其开源大模型而闻名的公司，不仅发布了其超大杯多模态模型Pixtral Large，还对标ChatGPT，对免费聊天机器人le Chat进行了全面升级，将最先进的AI技术以免费测试版的方式开放给全球用户。这标志着开源AI与闭源AI之间的差距正在迅速缩小，也预示着AI技术民主化的进程正在加速。

主体：

1. Pixtral Large：1240亿参数的开源多模态巨兽

Mistral AI推出的Pixtral Large，是一个基于Mistral Large 2构建的1240亿参数多模态模型。它具备顶尖的图像理解能力，能够轻松处理文档、图表和自然图像，同时保留了Mistral Large 2在纯文本理解方面的领先优势。该模型采用Mistral研究许可证(MRL)用于研究和教育用途，并可根据Mistral商业许可证用于商业目的的实验、测试和生产。

Pixtral Large并非一蹴而就。它前身是2024年夏季发布的Mistral Large 2，以及9月份发布的首个多模态模型Pixtral 12-B。Mistral AI CEO解释了将模型扩展到1240亿参数的初衷：“我们越来越意识到，要创造最佳的AI体验，需要共同设计模型和产品界面。Pixtral在训练时就考虑到了高影响力的前端应用，是一个很好的例子。”

该模型包含一个1230亿参数解码器和一个10亿参数视觉编码器，上下文窗口达到128K，能够处理至少30张高分辨率图像或约300页的书籍，性能与OpenAI的GPT系列模型相当。在MathVista、DocVQA和VQAv2等基准测试中，Pixtral Large均展现出最先进的性能，在MathVista上更是达到了69.4%的准确率，超越了所有其他模型。它在图表解释、文档分析和图像理解等任务上表现出色，能够准确理解并分析复杂的图表和文档，例如计算账单总额、分析训练损失曲线图，甚至根据图片信息识别使用Mistral AI模型的公司。

2. le Chat：全面升级，直面ChatGPT

Pixtral Large的发布，也为le Chat带来了显著提升。le Chat现在能够处理大型复杂的PDF文档和图像，包括图表、表格、文本、公式等，并进行信息提取、总结和语义理解。此外，le Chat还新增了实时网络搜索和交互式画布功能，进一步增强了其实用性和交互性。 Mistral AI表示，le Chat的大部分用户是学生和专业人士，这些新功能将极大提升他们的学习、研究和工作效率。

3. 开源AI的崛起

Mistral AI的持续更新，引发了整个AI社区的热议。正如一位业内人士所感叹：“六个月前，开源模型和闭源模型之间的差距非常大。现在，最先进的人工智能正在迅速向任何想要使用它的人开放。” Pixtral Large和升级后的le Chat，无疑是开源AI领域的一座里程碑，标志着开源AI正在迅速追赶甚至超越闭源AI。

结论：

Mistral AI的最新进展，不仅展现了其强大的技术实力，更重要的是，它推动了AI技术民主化的进程。Pixtral Large和升级后的le Chat，为研究人员、开发者和普通用户提供了强大的工具，将进一步促进AI技术的应用和发展。未来，我们有理由期待开源AI在更多领域发挥更大的作用，并为社会带来更大的福祉。然而，开源模型的商业化模式和伦理问题，也需要进一步探讨和规范。

参考文献：