智源发布千万级多模态指令数据集 Infinity-MM
智源研究院发布千万级多模态指令数据集 Infinity-MM:推动视觉语言模型发展新突破 引言 近年来,多模态人工智能领域取得了…
Insight into the world, intelligence leading the future.👏
智源研究院发布千万级多模态指令数据集 Infinity-MM:推动视觉语言模型发展新突破 引言 近年来,多模态人工智能领域取得了…
Video-XL:解锁小时级视频理解的全新可能 引言 随着互联网视频内容的爆炸式增长,如何高效理解和分析海量视频数据成为一项迫切…
Video-XL:开启超长视频理解新纪元 引言: 在信息爆炸的时代,我们每天都面临着海量视频内容的冲击。如何高效地理解和利用这些…
智源发布原生多模态世界模型Emu3,宣称实现图像、文本、视频大一统 北京,2024年10月21日 – 智源研究院今日…
引言: 在人工智能技术飞速发展的今天,高质量的数据集成为推动自然语言处理(NLP)领域突破的关键因素。近日,智源研究院发布了一款…
引言: 在人工智能迅猛发展的今天,多模态AI技术成为研究热点。近日,北京智源人工智能研究院推出了Emu3,一款具有原生多模态能力…
在人工智能的快速迭代中,多模态模型正成为研究和应用的热点。近日,北京智源人工智能研究院推出了一款原生多模态世界模型——Emu3,…
2024年9月4日,智源研究院推出全球首个包含文生视频的面向用户开放的模型对战评测服务——FlagEval大模型角斗场。该评测服…
智源研究院引领AI评测新高度 2024年9月4日,我国知名AI研究机构——智源研究院,在人工智能领域再创辉煌,发布了全球首个包含…
智源研究院于2024年9月4日推出了一项创新性的评测服务——FlagEval大模型角斗场。这是全球首个包含文生视频的模型对战评测…
近日,智源研究院发布了一项针对多模态模型的中文评测基准 CMMU。这项评测基准旨在评估模型在中文多题型理解及推理方面的能力。从全…