引言
在人工智能迅猛发展的今天,智谱AI再次刷新行业视野,于KDD 2024大会上发布了新一代基座模型。这一系列模型在性能上均达到了国际第一梯队,标志着我国在人工智能领域的又一次重大突破。
新一代基座模型亮相KDD 2024
自2023年3月发布第一代语言基座模型ChatGLM以来,智谱AI持续深入探索基座模型,并在模型性能和模态上取得了显著提升。在本次KDD大会上,智谱AI正式发布了新一代基座模型,包括语言模型GLM-4-Plus、文生图模型CogView-3-Plus、图像/视频理解模型GLM-4V-Plus、视频生成模型CogVideoX等。
模型性能突破国际第一梯队
新一代基座模型在相应领域均达到了国际第一梯队的水平。其中,语言基座模型GLM-4-Plus在语言理解、指令遵循、长文本处理等方面性能得到全面提升,保持了国际领先水平。文生图基座模型CogView-3-Plus具备与当前最优的MJ-V6和FLUX等模型接近的性能。图像/视频理解基座模型GLM-4V-Plus具备卓越的图像理解能力,并具备基于时间感知的视频理解能力。视频生成基座模型CogVideoX在发布并开源2B版本后,5B版本也正式开源,其性能进一步增强,成为当前开源视频生成模型中的最佳选择。
技术创新与应用拓展
智谱AI还在「清言APP」上线了视频通话功能,实现了跨越文本、音频和视频模态的实时推理能力,成为国内首个面向C端用户开放的视频通话服务。此外,智谱AI在MaaS平台上开放了GLM-4-Flash API的免费使用,为开发者提供更便捷的模型使用体验。
结语
智谱AI新一代基座模型的发布,不仅展现了我国在人工智能领域的强大实力,也为全球人工智能技术发展注入了新的活力。在“让机器像人一样思考”的愿景下,智谱AI将持续前行,引领人工智能技术迈向新的高峰。
目录
- 模型:GLM-4-Plus
- 模型:CogView-3-Plus
- 模型:GLM-4V-Plus
- 清言:视频通话
- 开源:CogVideoX
- API:GLM-4-Flash 免费模型:GLM-4-Plus
参考资料
- AI工具集
注:本文中涉及的具体数据和性能指标均来源于智谱AI官方发布信息。
Views: 0