news studionews studio

在KDD 2024大会上,国内知名人工智能企业智谱AI发布了一系列新一代基座模型,这些模型在语言、图像、视频等多个领域均达到了国际第一梯队的水平,标志着我国AI技术又迈出了重要的一步。

语言模型GLM-4-Plus:语言理解能力全面提升

智谱AI经过半年的理论研究,研发出了语言模型GLM-4-Plus。该模型通过多种方式构建了海量高质量数据,并利用PPO等多项技术,有效提升了模型在语言理解、指令遵循、长文本处理等方面的性能。GLM-4-Plus在各项指标上与GPT-4等国际领先模型持平,保持了国际领先水平。

文生图模型CogView-3-Plus:图像生成效果接近一线水平

在文生图模型方面,智谱AI采用Transformer架构替代了传统的UNet架构,优化了模型效果。CogView-3-Plus模型在预训练的基础上,能够生成更符合指令需求且具备更高美学评分的图像,其效果接近目前处于一线水平的MJ-V6和FLUX等模型。

图像/视频理解模型GLM-4V-Plus:国内首个通用图像&视频理解模型API

智谱AI基于CogVLM系列模型的研究经验,研发了具备高质量图像理解和视频理解能力的多模态模型GLM-4V-Plus。该模型具备超强的时间感知能力,并已正式上线开放平台(bigmodel.cn),成为国内首个通用图像&视频理解模型API。

视频生成模型CogVideoX:开源推动AI视频生成社区繁荣发展

智谱AI秉持开源理念,继开源CogVideoX-2B版本后,再次开源了参数规模更大、性能更强的产品级视频生成模型CogVideoX-5B。此次开源协议调整为Apache 2.0,进一步促进了AI视频生成社区的自主使用和开放式创新。

清言APP:国内首个面向C端用户开放的视频通话服务

智谱AI在「清言APP」上推出了视频通话功能,这是国内首个面向C端用户开放的视频通话服务。清言视频通话功能跨越了文本、音频和视频模态,具备实时推理能力,为用户带来如同真人视频通话般的体验。

GLM-4-Flash API:完全免费的大模型API

智谱AI在MaaS平台上开放了GLM-4-Flash API的免费使用,用户可以通过调用该API,快速且免费地构建专属模型和应用。此外,智谱AI还提供了模型微调服务,以满足不同用户的需求。

此次智谱AI发布的新一代基座模型,不仅提升了我国AI技术的整体水平,也为广大用户带来了更为丰富的人工智能应用体验。未来,智谱AI将继续秉持“让机器像人一样思考”的愿景,为推动我国AI技术的发展贡献力量。


read more

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注