阿里Ovis1.6超越GPT-4o-mini

作者智能小编

9 月 20, 2024 #每日AI快讯, #阿里

阿里国际AI团队最新力作：Ovis1.6

在人工智能领域，阿里国际AI团队再次引领前沿，推出了一款名为Ovis1.6的多模态大模型。这款模型不仅在多模态权威综合评测基准OpenCompass上取得了优异成绩，更在30亿参数以下的模型中综合得分排名第一，超越了包括闭源的GPT-4o-mini在内的其他主流模型。

Ovis1.6：多模态任务的全能选手

Ovis1.6具备强大的视觉感知推理、数学和科学问题解答、生活场景理解等多模态任务处理能力，能够处理包括文本和图像在内的多种数据输入。在数学推理、视觉理解等多项任务中，Ovis1.6的表现令人瞩目，甚至在某些方面超过了GPT-4o-mini。

技术创新：Ovis1.6的独到之处

Ovis1.6采用了创新的架构设计，基于视觉tokenizer加上视觉嵌入表和大语言模型的架构。通过引入可学习的视觉嵌入表，将连续的视觉特征转换为概率化的视觉token，再通过视觉嵌入表多次索引加权得到结构化的视觉嵌入，显著提升了多模态任务的表现。

高分图像处理与全面数据优化

Ovis1.6支持处理极端长宽比的图像，并兼容高分辨率图像，使模型在图像理解任务上展现出色的能力。在训练中，Ovis1.6使用了多种类型的数据集，包括Caption、VQA、OCR、Table、Chart等，全面的数据覆盖显著提升了模型在多模态问答、指令跟随等任务上的表现。

应用场景：教育、农业、医疗等领域的革新

Ovis1.6的应用场景广泛，从教育和学习辅助到农业和植物识别，再到语言翻译和文本处理，以及图像识别和分析，Ovis1.6都能发挥重要作用。在自动驾驶和医疗诊断领域，Ovis1.6同样展现出巨大的潜力，能够提高环境感知和决策能力，增强行车安全，辅助医生进行医学图像分析，提高疾病诊断的准确性和效率。

项目地址与技术论文

对于对Ovis1.6感兴趣的技术人员和研究人员，可以访问以下链接获取更多信息：

GitHub仓库：https://github.com/AIDC-AI/Ovis
HuggingFace模型库：https://huggingface.co/AIDC-AI/Ovis1.6-Gemma2-9B
arXiv技术论文：https://arxiv.org/pdf/2405.20797

Ovis1.6的推出，标志着阿里国际AI团队在多模态大模型领域取得了重要突破，为人工智能技术的发展注入了新的活力。

>>> Read more <<<

智能新闻

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

阿里Ovis1.6超越GPT-4o-mini

作者智能小编

阿里国际AI团队最新力作：Ovis1.6

Ovis1.6：多模态任务的全能选手

技术创新：Ovis1.6的独到之处

高分图像处理与全面数据优化

应用场景：教育、农业、医疗等领域的革新

项目地址与技术论文

相关文章

免费短剧，爆发式增长！或短剧免费：流量密码？或免费引爆！短剧狂飙

拼多多：降速，还是求变？拼多多战略转向：降速求变拼多多放慢脚步，谋求转型拼多多：从高速增长到精细运营拼多多：减速背后的战

阿里整合电商，家居小家电瞄准日本或者：阿里巴巴布局海外，日本成小家电新蓝海

发表回复取消回复

为您推荐

免费短剧，爆发式增长！或短剧免费：流量密码？或免费引爆！短剧狂飙

拼多多：降速，还是求变？拼多多战略转向：降速求变拼多多放慢脚步，谋求转型拼多多：从高速增长到精细运营拼多多：减速背后的战

阿里整合电商，家居小家电瞄准日本或者：阿里巴巴布局海外，日本成小家电新蓝海

石头科技：寻找下一个增长点石头科技谋求“第二曲线” 石头科技：转型升级在路上石头科技的第二曲线难题石头科技：巨头焦虑与突围

作者智能小编

阿里国际AI团队最新力作：Ovis1.6

Ovis1.6：多模态任务的全能选手

技术创新：Ovis1.6的独到之处

高分图像处理与全面数据优化

应用场景：教育、农业、医疗等领域的革新

项目地址与技术论文

相关文章

发表回复 取消回复

为您推荐

发表回复取消回复