智谱AI惊艳KDD 2024，新一代基座模型领跑全球

作者智能小编

9 月 5, 2024 #智谱, #每日AI快讯

news studio

在KDD 2024大会上，国内知名人工智能企业智谱AI发布了一系列新一代基座模型，这些模型在语言、图像、视频等多个领域均达到了国际第一梯队的水平，标志着我国AI技术又迈出了重要的一步。

语言模型GLM-4-Plus：语言理解能力全面提升

智谱AI经过半年的理论研究，研发出了语言模型GLM-4-Plus。该模型通过多种方式构建了海量高质量数据，并利用PPO等多项技术，有效提升了模型在语言理解、指令遵循、长文本处理等方面的性能。GLM-4-Plus在各项指标上与GPT-4等国际领先模型持平，保持了国际领先水平。

文生图模型CogView-3-Plus：图像生成效果接近一线水平

在文生图模型方面，智谱AI采用Transformer架构替代了传统的UNet架构，优化了模型效果。CogView-3-Plus模型在预训练的基础上，能够生成更符合指令需求且具备更高美学评分的图像，其效果接近目前处于一线水平的MJ-V6和FLUX等模型。

图像/视频理解模型GLM-4V-Plus：国内首个通用图像&视频理解模型API

智谱AI基于CogVLM系列模型的研究经验，研发了具备高质量图像理解和视频理解能力的多模态模型GLM-4V-Plus。该模型具备超强的时间感知能力，并已正式上线开放平台（bigmodel.cn），成为国内首个通用图像&视频理解模型API。

视频生成模型CogVideoX：开源推动AI视频生成社区繁荣发展

智谱AI秉持开源理念，继开源CogVideoX-2B版本后，再次开源了参数规模更大、性能更强的产品级视频生成模型CogVideoX-5B。此次开源协议调整为Apache 2.0，进一步促进了AI视频生成社区的自主使用和开放式创新。

清言APP：国内首个面向C端用户开放的视频通话服务

智谱AI在「清言APP」上推出了视频通话功能，这是国内首个面向C端用户开放的视频通话服务。清言视频通话功能跨越了文本、音频和视频模态，具备实时推理能力，为用户带来如同真人视频通话般的体验。

GLM-4-Flash API：完全免费的大模型API

智谱AI在MaaS平台上开放了GLM-4-Flash API的免费使用，用户可以通过调用该API，快速且免费地构建专属模型和应用。此外，智谱AI还提供了模型微调服务，以满足不同用户的需求。

此次智谱AI发布的新一代基座模型，不仅提升了我国AI技术的整体水平，也为广大用户带来了更为丰富的人工智能应用体验。未来，智谱AI将继续秉持“让机器像人一样思考”的愿景，为推动我国AI技术的发展贡献力量。

智能新闻

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

智谱AI惊艳KDD 2024，新一代基座模型领跑全球

作者智能小编

语言模型GLM-4-Plus：语言理解能力全面提升

文生图模型CogView-3-Plus：图像生成效果接近一线水平

图像/视频理解模型GLM-4V-Plus：国内首个通用图像&视频理解模型API

视频生成模型CogVideoX：开源推动AI视频生成社区繁荣发展

清言APP：国内首个面向C端用户开放的视频通话服务

GLM-4-Flash API：完全免费的大模型API

相关文章

ChineseBenchmark Exposes AI Hallucination Problem OpenAI Model Barely Passes

中文评测集挑战AI：OpenAI模型仅及格或：AI“幻觉”难题：中文评测集亮红灯

GermanScientists Consciousness is a Simulated Dream Not Physical Reality

发表回复取消回复

为您推荐

ChineseBenchmark Exposes AI Hallucination Problem OpenAI Model Barely Passes

中文评测集挑战AI：OpenAI模型仅及格或：AI“幻觉”难题：中文评测集亮红灯

GermanScientists Consciousness is a Simulated Dream Not Physical Reality

德国科学家：意识是场梦？AI能有梦吗？

作者智能小编

语言模型GLM-4-Plus：语言理解能力全面提升

文生图模型CogView-3-Plus：图像生成效果接近一线水平

图像/视频理解模型GLM-4V-Plus：国内首个通用图像&视频理解模型API

视频生成模型CogVideoX：开源推动AI视频生成社区繁荣发展

清言APP：国内首个面向C端用户开放的视频通话服务

GLM-4-Flash API：完全免费的大模型API

相关文章

发表回复 取消回复

为您推荐

发表回复取消回复