北京—— 在人工智能领域竞争日益激烈的今天,中国本土AI企业智谱AI再次以其强大的技术实力和创新精神,引发业界广泛关注。近日,智谱AI正式发布了包括GLM-Realtime、GLM-4V-Plus和GLM-4-Air在内的多款全新模型,并在其官方平台bigmodel.cn上线。此次发布不仅展现了智谱AI在多模态模型领域的深厚积累,更标志着其在实时交互、高性价比解决方案以及普惠AI方面的战略布局取得了重大进展。
引领实时交互:GLM-Realtime模型的突破
在众多新模型中,最引人注目的莫过于GLM-Realtime模型。这款模型以其低延迟的视频理解和语音交互能力,开创了人工智能实时交互的新纪元。GLM-Realtime模型不仅能够实时理解视频内容,还能进行流畅的语音对话,其创新性地融入了“清唱”功能,使得大模型首次具备在对话中歌唱的能力。这一功能的实现,无疑为未来的智能交互带来了无限可能,例如,在智能家居、教育娱乐等领域,用户可以通过语音指令让AI助手唱歌,从而获得更加自然和人性化的体验。
2分钟记忆与Function Call:拓展应用场景
GLM-Realtime模型另一项重要突破是其长达2分钟的记忆能力。这意味着模型可以记住用户在两分钟内的对话内容和上下文信息,从而进行更加连贯和智能的交互。此外,GLM-Realtime还支持Function Call功能,使其不仅能够依靠自身的知识和能力,还能灵活调用外部知识和工具,从而拓展到更广泛的商业场景。例如,在智能客服领域,GLM-Realtime可以通过调用外部数据库,为用户提供更加准确和全面的信息服务。
免费体验:加速AI硬件的普及
为了让更多用户体验到GLM-Realtime模型的强大功能,智谱AI决定限时免费开放该模型的API。这一举措不仅降低了用户的使用门槛,也为AI硬件的爆发奠定了坚实的智能基础。智谱AI已经将Realtime API集成到智能眼镜和陪伴娃娃等产品中,用户可以通过这些设备体验到近乎实时的智能助手交互。这一举措体现了智谱AI对于技术普惠的坚定决心。
高性价比之选:GLM-4-Air与GLM-4V-Plus的全面升级
除了GLM-Realtime模型,智谱AI还对GLM-4-Air和GLM-4V-Plus模型进行了全面升级。GLM-4-Air模型自上线以来,就以其“高性价比”受到平台开发者的欢迎。此次升级后的GLM-4-Air-0111模型,通过对训练数据和训练流程的全面优化,在某些维度可以取得与规模更大的模型GLM-4-Plus接近的性能。更令人惊喜的是,GLM-4-Air-0111模型的价格降至原来的50%,再次降低了大模型应用的门槛,为中小企业和开发者提供了更加经济实惠的选择。
视觉理解的飞跃:GLM-4V-Plus的性能提升
在视觉理解方面,智谱AI对GLM-4V-Plus模型也进行了全面升级。新版本在多个公开榜单上均展现出显著的效果提升。此外,更新后的GLM-4V-Plus支持变分辨率功能,能够适应不同尺寸的图像输入,在小图场景下显著降低token消耗。例如,在224 * 224的分辨率下,输入的图像token数仅为原来的3%。同时,GLM-4V-Plus还支持4K超清图像和极致长宽比图像的无损识别,为用户提供了更加清晰和准确的视觉理解体验。
长视频理解:GLM-4V-Plus的又一突破
GLM-4V-Plus的另一项重要升级是其长达2小时的视频理解能力。这一突破为长视频理解和分析领域提供了更加高效、精准的解决方案。例如,在视频监控、内容审核等领域,GLM-4V-Plus可以快速分析长视频内容,从而提高工作效率和准确性。
普惠AI:Flash系列模型的全面免费开放
智谱AI始终致力于“大模型普惠”,为了让所有开发者更便捷地利用大模型进行创新,专门设置了针对全社会免费开放的Flash系列普惠模型API。作为行业首个全模态的免费系列模型,开发者可以免费调用语言、多模态理解、多模态生成功能。
Flash全模态全家桶:助力开发者创新
近期,Flash系列也将全面升级,Flash全模态全家桶成员包括:
- 语言模型 GLM-4-Flash:提供强大的自然语言处理能力。
- 图像理解模型 GLM-4V-Flash:提供高效的图像理解和分析能力。
- 图像生成模型 CogView-3-Flash:提供高质量的图像生成能力。
- 视频生成模型 CogVideoX-Flash:提供强大的视频生成能力。
Flash系列模型的全面免费开放,无疑为广大开发者提供了强大的工具,助力他们更加便捷地进行应用创新。
智谱AI的战略布局:技术创新与普惠AI并举
此次智谱AI发布多款新模型,不仅展现了其在技术创新方面的强大实力,也体现了其在普惠AI方面的坚定决心。智谱AI通过不断推出高性能、高性价比的AI模型,并将其免费开放给开发者,旨在降低AI的使用门槛,让更多人能够享受到AI技术带来的便利。
多模态模型的深耕:智谱AI的长期战略
智谱AI此次发布的模型涵盖了语言、语音、图像和视频等多个模态,体现了其在多模态模型领域的深耕。多模态模型是未来AI发展的重要方向,它能够更好地理解和处理现实世界中的复杂信息。智谱AI通过不断研发和升级多模态模型,旨在为用户提供更加智能和全面的AI解决方案。
开放平台:bigmodel.cn的价值
所有新模型API均已正式上线bigmodel.cn,欢迎广大开发者访问体验。bigmodel.cn作为智谱AI的开放平台,不仅为开发者提供了强大的AI模型和工具,也为他们提供了一个交流和合作的平台。通过bigmodel.cn,智谱AI希望能够与开发者共同推动AI技术的发展和应用。
结论:AI技术的未来展望
智谱AI此次发布的多款新模型,标志着中国本土AI企业在技术创新和普惠AI方面取得了重大进展。GLM-Realtime模型的实时交互能力、GLM-4-Air和GLM-4V-Plus模型的高性价比以及Flash系列模型的全面免费开放,都将为AI技术的未来发展注入新的活力。随着AI技术的不断进步和普及,我们有理由相信,AI将在未来的社会发展中发挥更加重要的作用。智谱AI作为中国AI领域的领军企业,将继续致力于技术创新,为用户和伙伴提供世界一流水平的国产大模型技术、产品和服务,共同迎接AI时代的到来。
参考文献
- 智谱AI官方微信公众号文章:《智谱Realtime、4V、Air新模型发布,上线bigmodel.cn》
- 智谱AI官方网站:bigmodel.cn
- 相关人工智能领域学术论文和技术报告
Views: 0