智谱全家桶KDD闪耀，GLM-4-Plus部分超GPT-4，清言视频通话来袭

9 月 2, 2024 #GLM, #智谱, #机器之心

近日，在数据挖掘领域顶级会议KDD 2024上，中国科技企业智谱AI携新一代基座大模型GLM-4-Plus及全家桶亮相，引发广泛关注。GLM-4-Plus在多项任务上逼近甚至超越GPT-4o，展示了中国大模型在全球舞台上的强大实力。此外，智谱清言视频通话功能的首批用户已开放，为AI交互带来新体验。

性能全面提升，GLM-4-Plus逼近GPT-4o

在KDD 2024的大语言模型日（Large Language Model Day）上，智谱AI顾晓韬博士介绍了GLM-4-Plus，这是智谱全自研GLM大模型的最新版本。GLM-4-Plus在语言理解、指令遵循、长文本处理等方面性能得到全面提升，保持了国际领先水平。

经过一手实测，GLM-4-Plus在通用知识、视觉理解、图像生成等方面表现出色，逼近甚至超越GPT-4o。在逻辑推理任务中，GLM-4-Plus能够准确解答“数字比较”和“瓶子装水”等经典问题，展示了其强大的推理能力。

智谱AI还发布了图像/视频理解模型GLM-4V-Plus，具备卓越的图像理解能力和基于时间感知的视频理解能力。GLM-4V-Plus能够对复杂视频内容进行透彻的理解与分析，并实现与人类类似的沟通。

在测试中，GLM-4V-Plus准确理解了篮球比赛现场视频的内容，对人物行为、表情以及场景进行了全面描述。此外，它还能根据视频内容生成对应的html代码，展现了其强大的视频理解能力。

此次亮相的文生图模型CogView-3-Plus，具备与当前最优的MJ-V6和FLUX等模型接近的性能。CogView-3-Plus能够准确生成单词，还原人物面部特征，甚至理解古诗词中的意境，展示了其在图像生成领域的强大实力。

在此次KDD大会上，智谱清言正式上线了视频通话功能，首批面向部分用户开放。作为国内首个将视频通话功能融入生成式AI助手的公司，智谱AI为用户带来了全新的交互体验。

视频通话功能的加入，使得智谱清言不仅能够写、听、说，还能看。这一创新举措为AI交互方式带来了新的可能性，也为用户提供了更加便捷的服务。

智谱AI新一代基座大模型GLM-4-Plus的亮相，展示了中国大模型在全球舞台上的强大实力。GLM-4-Plus在多项任务上逼近甚至超越GPT-4o，视觉理解能力显著提升。同时，智谱清言视频通话功能的惊艳亮相，为AI交互带来了新的体验。这些成果标志着中国在AI领域正逐步走向世界舞台的中心。