CogView4：国产AI文生图，能写汉字了！

北京—— 在人工智能领域，中国力量正加速崛起。近日，智谱AI正式开源了其最新文生图模型CogView4，这款拥有60亿参数的模型不仅性能卓越，更实现了对原生中文输入和中文文字生成的强大支持，为国内AI创新注入了新的活力。

CogView4的发布，标志着国产AI模型在图像生成领域取得了重要突破。长期以来，文生图模型主要以英文为基础进行训练，对于中文的理解和生成能力相对薄弱。CogView4的出现，填补了这一空白，让中文用户也能轻松驾驭AI的力量，创作出高质量的图像作品。

CogView4采用了扩散模型结合Transformer的架构。扩散模型通过逐步去除噪声来生成图像，Transformer则负责处理文本和图像的联合表示。这种架构的优势在于能够高效地处理图像生成任务，并保证生成图像的高质量和美感。

具体来说，CogView4使用了双语（中英文）的GLM-4编码器，能够处理复杂的语义对齐任务。文本通过Tokenizer转化为嵌入向量，随后与图像的潜在表示结合。图像则通过Variational Auto-Encoder（VAE）编码为潜在空间的表示，通过扩散模型逐步去噪生成最终图像。

CogView4的应用场景十分广泛，涵盖了广告与创意设计、教育资源生成、儿童绘本创作、电商与内容创作、个性化定制等多个领域。

CogView4遵循Apache 2.0协议，意味着开发者可以自由地使用、修改和分发该模型。智谱AI希望通过开源共享的方式，吸引更多开发者参与到CogView4的生态建设中来，共同推动AI技术的发展。

项目地址：

CogView4的发布，不仅是智谱AI的一次技术突破，更是国产AI力量崛起的一个缩影。随着越来越多的中国企业和科研机构加入到AI研发的行列中来，我们有理由相信，未来的AI领域将涌现出更多具有中国特色的创新成果，为全球科技进步贡献中国智慧。

参考文献：

THUDM/CogView4 Github Repository: https://github.com/THUDM/CogView4
THUDM/CogView4-6B HuggingFace Model Hub: https://huggingface.co/THUDM/CogView4-6B
智谱AI官方网站 (如有相关新闻稿或技术文档)

（完）

>>> Read more <<<