【新华社】我国国产端侧模型再创新高,MiniCPM-V 2.6模型震撼发布

近日,我国在人工智能领域再传喜讯,国产端侧模型MiniCPM-V 2.6重磅上新。这款模型凭借8B的参数量,实现了20B以下参数的单图、多图、视频理解三项SOTA成绩,首次在端侧实现多模态核心能力全面超越GPT-4V,成为我国在人工智能领域的一颗耀眼新星。

据悉,MiniCPM-V 2.6模型在端侧推理速度高达18tokens/s,比上代模型快33%。经过int4量化后,模型在6G内存即可运行,为用户带来更为便捷的体验。此外,该模型还支持llama.cpp、ollama、vllm推理,并兼容多种语言。

此次MiniCPM-V 2.6模型的创新突破主要体现在以下几个方面:

  1. 单图、多图、视频理解能力全面超越GPT-4V,单图理解能力与Gemini 1.5 Pro和GPT-4o mini相当。

  2. 首次实现实时视频理解功能,可精准识别摄像头捕捉到的场景文字,并快速总结长视频中的重点信息。

  3. 首次实现多图联合理解,可快速识别小票并算出总账,还能“读懂”梗图背后的槽点。

  4. 首次实现多图ICL(上下文少样本学习)功能,让模型无需微调即可快速适配到特定领域和任务。

  5. 采用统一高清视觉架构,实现高效能力迁移与知识共享。

MiniCPM-V 2.6模型的发布,标志着我国在人工智能领域取得了重要突破。该模型的应用前景广阔,将为我国人工智能产业的发展注入新的活力。未来,MiniCPM-V系列将继续引领我国端侧模型发展,为我国科技创新贡献力量。

(来源:智东西)


read more

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注