智谱连发三弹！实时视频、多模态、轻量模型齐上线

北京—— 在人工智能领域竞争日益激烈的今天，中国本土AI企业智谱AI再次以其强大的技术实力和创新精神，引发业界广泛关注。近日，智谱AI正式发布了包括GLM-Realtime、GLM-4V-Plus和GLM-4-Air在内的多款全新模型，并在其官方平台bigmodel.cn上线。此次发布不仅展现了智谱AI在多模态模型领域的深厚积累，更标志着其在实时交互、高性价比解决方案以及普惠AI方面的战略布局取得了重大进展。

引领实时交互：GLM-Realtime模型的突破

在众多新模型中，最引人注目的莫过于GLM-Realtime模型。这款模型以其低延迟的视频理解和语音交互能力，开创了人工智能实时交互的新纪元。GLM-Realtime模型不仅能够实时理解视频内容，还能进行流畅的语音对话，其创新性地融入了“清唱”功能，使得大模型首次具备在对话中歌唱的能力。这一功能的实现，无疑为未来的智能交互带来了无限可能，例如，在智能家居、教育娱乐等领域，用户可以通过语音指令让AI助手唱歌，从而获得更加自然和人性化的体验。

2分钟记忆与Function Call：拓展应用场景

GLM-Realtime模型另一项重要突破是其长达2分钟的记忆能力。这意味着模型可以记住用户在两分钟内的对话内容和上下文信息，从而进行更加连贯和智能的交互。此外，GLM-Realtime还支持Function Call功能，使其不仅能够依靠自身的知识和能力，还能灵活调用外部知识和工具，从而拓展到更广泛的商业场景。例如，在智能客服领域，GLM-Realtime可以通过调用外部数据库，为用户提供更加准确和全面的信息服务。

免费体验：加速AI硬件的普及

为了让更多用户体验到GLM-Realtime模型的强大功能，智谱AI决定限时免费开放该模型的API。这一举措不仅降低了用户的使用门槛，也为AI硬件的爆发奠定了坚实的智能基础。智谱AI已经将Realtime API集成到智能眼镜和陪伴娃娃等产品中，用户可以通过这些设备体验到近乎实时的智能助手交互。这一举措体现了智谱AI对于技术普惠的坚定决心。

高性价比之选：GLM-4-Air与GLM-4V-Plus的全面升级

除了GLM-Realtime模型，智谱AI还对GLM-4-Air和GLM-4V-Plus模型进行了全面升级。GLM-4-Air模型自上线以来，就以其“高性价比”受到平台开发者的欢迎。此次升级后的GLM-4-Air-0111模型，通过对训练数据和训练流程的全面优化，在某些维度可以取得与规模更大的模型GLM-4-Plus接近的性能。更令人惊喜的是，GLM-4-Air-0111模型的价格降至原来的50%，再次降低了大模型应用的门槛，为中小企业和开发者提供了更加经济实惠的选择。

视觉理解的飞跃：GLM-4V-Plus的性能提升

在视觉理解方面，智谱AI对GLM-4V-Plus模型也进行了全面升级。新版本在多个公开榜单上均展现出显著的效果提升。此外，更新后的GLM-4V-Plus支持变分辨率功能，能够适应不同尺寸的图像输入，在小图场景下显著降低token消耗。例如，在224 * 224的分辨率下，输入的图像token数仅为原来的3%。同时，GLM-4V-Plus还支持4K超清图像和极致长宽比图像的无损识别，为用户提供了更加清晰和准确的视觉理解体验。

长视频理解：GLM-4V-Plus的又一突破

GLM-4V-Plus的另一项重要升级是其长达2小时的视频理解能力。这一突破为长视频理解和分析领域提供了更加高效、精准的解决方案。例如，在视频监控、内容审核等领域，GLM-4V-Plus可以快速分析长视频内容，从而提高工作效率和准确性。

普惠AI：Flash系列模型的全面免费开放

智谱AI始终致力于“大模型普惠”，为了让所有开发者更便捷地利用大模型进行创新，专门设置了针对全社会免费开放的Flash系列普惠模型API。作为行业首个全模态的免费系列模型，开发者可以免费调用语言、多模态理解、多模态生成功能。

Flash全模态全家桶：助力开发者创新

近期，Flash系列也将全面升级，Flash全模态全家桶成员包括：

语言模型 GLM-4-Flash：提供强大的自然语言处理能力。
图像理解模型 GLM-4V-Flash：提供高效的图像理解和分析能力。
图像生成模型 CogView-3-Flash：提供高质量的图像生成能力。
视频生成模型 CogVideoX-Flash：提供强大的视频生成能力。

Flash系列模型的全面免费开放，无疑为广大开发者提供了强大的工具，助力他们更加便捷地进行应用创新。

智谱AI的战略布局：技术创新与普惠AI并举

此次智谱AI发布多款新模型，不仅展现了其在技术创新方面的强大实力，也体现了其在普惠AI方面的坚定决心。智谱AI通过不断推出高性能、高性价比的AI模型，并将其免费开放给开发者，旨在降低AI的使用门槛，让更多人能够享受到AI技术带来的便利。

多模态模型的深耕：智谱AI的长期战略

智谱AI此次发布的模型涵盖了语言、语音、图像和视频等多个模态，体现了其在多模态模型领域的深耕。多模态模型是未来AI发展的重要方向，它能够更好地理解和处理现实世界中的复杂信息。智谱AI通过不断研发和升级多模态模型，旨在为用户提供更加智能和全面的AI解决方案。

开放平台：bigmodel.cn的价值

所有新模型API均已正式上线bigmodel.cn，欢迎广大开发者访问体验。bigmodel.cn作为智谱AI的开放平台，不仅为开发者提供了强大的AI模型和工具，也为他们提供了一个交流和合作的平台。通过bigmodel.cn，智谱AI希望能够与开发者共同推动AI技术的发展和应用。

结论：AI技术的未来展望

智谱AI此次发布的多款新模型，标志着中国本土AI企业在技术创新和普惠AI方面取得了重大进展。GLM-Realtime模型的实时交互能力、GLM-4-Air和GLM-4V-Plus模型的高性价比以及Flash系列模型的全面免费开放，都将为AI技术的未来发展注入新的活力。随着AI技术的不断进步和普及，我们有理由相信，AI将在未来的社会发展中发挥更加重要的作用。智谱AI作为中国AI领域的领军企业，将继续致力于技术创新，为用户和伙伴提供世界一流水平的国产大模型技术、产品和服务，共同迎接AI时代的到来。

参考文献

智谱AI官方微信公众号文章：《智谱Realtime、4V、Air新模型发布，上线bigmodel.cn》
智谱AI官方网站：bigmodel.cn
相关人工智能领域学术论文和技术报告

>>> Read more <<<

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

智谱连发三弹！实时视频、多模态、轻量模型齐上线

作者智能小编