正文:
近日,Mistral团队发布了其首个多模态模型——Pixtral 12B。这个模型直接以24GB的磁力链接形式发布,体现了Mistral团队一贯的“人狠话不多”风格。
Pixtral 12B的磁力链接已上传至Hugging Face,感兴趣的用户可以前往下载和使用。该模型参数量为12B,包含视觉编码器,支持1024×1024大小的图像,有24个隐藏层,支持高级图像处理。此外,Pixtral 12B的词汇库有131,072个不同的token,能实现非常细腻的语言理解和生成。
Mistral团队在AI Summit上展示了Pixtral 12B的一些具体应用案例,包括OCR将科学文章图片转录成Markdown格式、识别潦草手写内容、提取图片信息和描述图像内容等。该模型在MMMU和MathVista等多模态知识和推理性能上均领先其他模型。
Mistral AI的愿景是让AI好用且有用。他们认为,要让AI有用,最关键的是解决系统问题,简化用户使用流程,降低使用成本。为此,Mistral将复杂的技术部分整合进La Platforme,让用户只需进行简单配置就能享受AI带来的便利和效率。
Mistral AI成立于2023年5月,是一家法国人工智能初创公司。在AI领域普遍关注营销宣传的当下,Mistral AI以其创新技术和低调风格赢得了广泛关注。
总之,Mistral发布的Pixtral 12B多模态模型为AI领域带来了新的突破,有望在多个领域发挥重要作用。我们期待Mistral AI在未来继续为AI发展贡献力量。
Views: 1