北京讯 – 中科闻歌近日正式发布其企业级大语言模型旗舰版本——YAYI-Ultra(雅意)。这款混合专家模型旨在为企业提供强大的多领域专业能力和多模态内容生成能力,尤其在缓解垂直领域迁移中常见的“跷跷板”现象方面表现突出。
YAYI-Ultra:多领域专长的混合专家模型
YAYI-Ultra的核心在于其混合专家架构,该架构支持数学、代码、金融、舆情、中医、安全等多个领域的专家组合。这种设计旨在解决传统稠密模型在垂直领域迁移时出现的性能瓶颈,即“跷跷板”现象——在某个领域表现提升的同时,在其他领域表现下降。通过整合不同领域的专家知识,YAYI-Ultra能够为企业提供更全面、更精准的智能化解决方案。
技术亮点:超长文本处理与多模态生成
除了多领域专业能力,YAYI-Ultra还具备以下显著的技术特点:
- 超长文输出: 支持最长128k的输入和更长的上下文窗口,这意味着模型可以处理和生成更长的文本内容,满足企业在报告撰写、文档分析等方面的需求。
- 多模态内容生成: 具备超过1000万图文数据对齐的多模态能力,能够根据用户的问题从知识库中提取相关信息,并同步给出对应的图片内容,实现图文并茂的输出。
- 复杂任务智能规划: 增强了多工具串行调用场景下的规划合理性,能够将复杂任务拆解为多个子任务,并通过调用搜索引擎、代码解释器、图像解析等基础工具,以及新闻热榜追踪、传播影响力分析等垂直领域工具来完成任务。
- 联网智能创作: 支持联网收集信息完成创作,例如撰写关于中国儒家文化发展历史的分析报告。
评测表现:跻身国内大模型前列
在OpenCompass大模型公开学术榜单中,YAYI-Ultra以64.5分的成绩首次闯入前十,成为TOP10中五个中国大模型之一。在代码生成(LiveCodeBench)、复杂指令理解(IFEval)和知识推理能力(MMLU-Pro)等方面均表现出色,部分指标甚至超越了GPT-4o的早期版本。
应用场景:赋能媒体、医疗、财税等行业
中科闻歌表示,YAYI-Ultra已在多个行业展现出应用潜力:
- 媒体领域: 帮助客户将内容创作时间缩短30%-50%,内容发布频率提升20%-40%,内容差错率从5%降至0.5%左右。
- 医疗领域: 基于YAYI的大医金匮中医大模型,可精准诊断500余种常见病症,辨证推理准确率高达90%,并面向C端用户推出了“大医金匮”中医健康管理APP。
- 财税领域: 基于YAYI的财税知识大模型,模型回答准确率90.1%,高于其他同类型模型,客户实现24小时不间断的咨询服务。
开源与开放:推动AI生态发展
为了推动AI技术的普及和发展,中科闻歌也开放了YAYI-Ultra的项目地址,包括Github仓库和HuggingFace模型库,供开发者和研究者使用。
结语:企业级AI的新选择
YAYI-Ultra的发布,标志着中科闻歌在企业级大语言模型领域迈出了重要一步。凭借其混合专家架构、超长文本处理能力和多模态生成能力,YAYI-Ultra有望成为企业数字化转型的重要驱动力。未来,随着AI技术的不断发展,我们期待看到YAYI-Ultra在更多领域发挥更大的作用。
参考文献:
- AI工具集. (n.d.). YAYI-Ultra – 中科闻歌推出的混合专家模型. Retrieved from https://www.ai-tool.cn/ai-project/yayi-ultra.html
- Github仓库:https://github.com/wenge-research/YAYI2
- HuggingFace模型库:https://huggingface.co/wenge-research
Views: 0