Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

智谱AI开源CogView3:AI图像生成领域的新突破

清华大学联合智谱AI发布开源AI图像生成模型CogView3,在生成质量和速度上超越现有开源模型SDXL,展现出在图像生成领域的显著优势。

近年来,AI图像生成技术发展迅速,各种模型层出不穷。然而,大多数模型要么生成质量不高,要么推理速度缓慢,难以满足实际应用需求。为了突破这一瓶颈,清华大学联合智谱AI推出了开源AI图像生成模型CogView3,该模型采用中继扩散技术,分阶段生成图像,首先创建低分辨率图像,然后通过中继超分辨率技术提升至高分辨率,提高生成效率并降低成本。

CogView3在生成质量和速度上均超越现有的开源模型SDXL,实现在保持图像细节的同时,大幅减少推理时间。此外,CogView3的精简版本在仅使用SDXL十分之一推理时间的情况下,依然能保持可比的性能,展现出在图像生成领域的显著优势。

CogView3的主要功能:

  • 中继扩散技术:分阶段生成图像,首先创建低分辨率图像,然后基于中继超分辨率技术提升至高分辨率。
  • 高性能:在人类评估中,CogView3的生成质量优于现有的最先进模型SDXL,并且推理速度快。
  • 高效率:CogView3的推理时间比SDXL快了约一半,其精简变体快了十倍。
  • 多分辨率支持:生成从512×512到2048×2048不等的多种分辨率的图像。

CogView3的技术原理:

CogView3采用级联框架,基于多阶段生成过程,逐步提高图像分辨率。在生成低分辨率图像后,添加高斯噪声并从中继点开始扩散过程,生成高分辨率图像。为了提高生成图像的质量和速度,CogView3使用了Zero-SNR扩散噪声调度方法,并结合文本和图像信息,用注意力机制提高生成图像与文本描述的一致性。此外,CogView3还使用了变分自编码器(VAE)和蒸馏技术,进一步降低计算成本和提高生成效率。

CogView3的应用场景:

CogView3的开源特性使其在多个领域具有广泛的应用前景,例如:

  • 艺术创作:艺术家和设计师可以用CogView3生成独特的艺术作品或设计草图,作为创作灵感的起点。
  • 数字娱乐:在游戏和电影制作中,模型可以快速生成场景概念图或角色设计,加速前期制作流程。
  • 广告和营销:营销人员可以用CogView3设计吸引人的广告图像,满足不同营销渠道的视觉需求。
  • 虚拟试穿:在时尚行业,用户可以通过上传图片和选择样式,用CogView3生成服装试穿效果。
  • 个性化礼品定制:为用户提供个性化的礼品设计,如定制T恤、杯子或手机壳等,通过图像生成满足个性化需求。

CogView3的开源发布,不仅为AI图像生成领域带来了新的技术突破,也为更多开发者和研究人员提供了探索和应用的机会。 随着AI技术的不断发展,相信CogView3将进一步推动AI图像生成技术的应用,为各行各业带来新的可能性。

项目地址:

  • GitHub仓库:https://github.com/THUDM/CogView3
  • arXiv技术论文:https://arxiv.org/pdf/2403.05121
  • CogView-3-Plus:https://ai-bot.cn/cogview-3-plus/
  • 智谱清言产品体验:https://ai-bot.cn/sites/2005.html

总结:

CogView3的开源发布,标志着AI图像生成领域又迈出了重要的一步。该模型在生成质量、速度和效率方面都取得了显著进步,为各行各业的应用提供了新的可能。相信随着AI技术的不断发展,CogView3将进一步推动AI图像生成技术的应用,为人类社会带来更多便利和价值。


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注