近日,在数据挖掘领域顶级会议KDD 2024上,中国科技企业智谱AI携新一代基座大模型GLM-4-Plus及全家桶亮相,引发广泛关注。GLM-4-Plus在多项任务上逼近甚至超越GPT-4o,展示了中国大模型在全球舞台上的强大实力。此外,智谱清言视频通话功能的首批用户已开放,为AI交互带来新体验。
性能全面提升,GLM-4-Plus逼近GPT-4o
在KDD 2024的大语言模型日(Large Language Model Day)上,智谱AI顾晓韬博士介绍了GLM-4-Plus,这是智谱全自研GLM大模型的最新版本。GLM-4-Plus在语言理解、指令遵循、长文本处理等方面性能得到全面提升,保持了国际领先水平。
经过一手实测,GLM-4-Plus在通用知识、视觉理解、图像生成等方面表现出色,逼近甚至超越GPT-4o。在逻辑推理任务中,GLM-4-Plus能够准确解答“数字比较”和“瓶子装水”等经典问题,展示了其强大的推理能力。
视觉理解能力显著提升,GLM-4V-Plus惊艳亮相
智谱AI还发布了图像/视频理解模型GLM-4V-Plus,具备卓越的图像理解能力和基于时间感知的视频理解能力。GLM-4V-Plus能够对复杂视频内容进行透彻的理解与分析,并实现与人类类似的沟通。
在测试中,GLM-4V-Plus准确理解了篮球比赛现场视频的内容,对人物行为、表情以及场景进行了全面描述。此外,它还能根据视频内容生成对应的html代码,展现了其强大的视频理解能力。
文生图模型CogView-3-Plus表现惊艳
此次亮相的文生图模型CogView-3-Plus,具备与当前最优的MJ-V6和FLUX等模型接近的性能。CogView-3-Plus能够准确生成单词,还原人物面部特征,甚至理解古诗词中的意境,展示了其在图像生成领域的强大实力。
智谱清言视频通话功能惊艳亮相
在此次KDD大会上,智谱清言正式上线了视频通话功能,首批面向部分用户开放。作为国内首个将视频通话功能融入生成式AI助手的公司,智谱AI为用户带来了全新的交互体验。
视频通话功能的加入,使得智谱清言不仅能够写、听、说,还能看。这一创新举措为AI交互方式带来了新的可能性,也为用户提供了更加便捷的服务。
总结
智谱AI新一代基座大模型GLM-4-Plus的亮相,展示了中国大模型在全球舞台上的强大实力。GLM-4-Plus在多项任务上逼近甚至超越GPT-4o,视觉理解能力显著提升。同时,智谱清言视频通话功能的惊艳亮相,为AI交互带来了新的体验。这些成果标志着中国在AI领域正逐步走向世界舞台的中心。
Views: 0