【新华社】我国国产端侧模型再创新高,MiniCPM-V 2.6模型震撼发布
近日,我国在人工智能领域再传喜讯,国产端侧模型MiniCPM-V 2.6重磅上新。这款模型凭借8B的参数量,实现了20B以下参数的单图、多图、视频理解三项SOTA成绩,首次在端侧实现多模态核心能力全面超越GPT-4V,成为我国在人工智能领域的一颗耀眼新星。
据悉,MiniCPM-V 2.6模型在端侧推理速度高达18tokens/s,比上代模型快33%。经过int4量化后,模型在6G内存即可运行,为用户带来更为便捷的体验。此外,该模型还支持llama.cpp、ollama、vllm推理,并兼容多种语言。
此次MiniCPM-V 2.6模型的创新突破主要体现在以下几个方面:
-
单图、多图、视频理解能力全面超越GPT-4V,单图理解能力与Gemini 1.5 Pro和GPT-4o mini相当。
-
首次实现实时视频理解功能,可精准识别摄像头捕捉到的场景文字,并快速总结长视频中的重点信息。
-
首次实现多图联合理解,可快速识别小票并算出总账,还能“读懂”梗图背后的槽点。
-
首次实现多图ICL(上下文少样本学习)功能,让模型无需微调即可快速适配到特定领域和任务。
-
采用统一高清视觉架构,实现高效能力迁移与知识共享。
MiniCPM-V 2.6模型的发布,标志着我国在人工智能领域取得了重要突破。该模型的应用前景广阔,将为我国人工智能产业的发展注入新的活力。未来,MiniCPM-V系列将继续引领我国端侧模型发展,为我国科技创新贡献力量。
(来源:智东西)
Views: 0