阿里通义再升级！ACE++图像模型震撼发布

北京 – 阿里巴巴通义实验室近日正式推出其升级版图像生成与编辑模型ACE++，标志着AI在图像处理领域又向前迈出了重要一步。这款工具不仅能够根据用户的指令生成高质量图像，还能对现有图像进行精细化编辑，为设计、电商、娱乐等行业带来了全新的可能性。

ACE++：不止是图像生成，更是智能编辑

ACE++并非简单的图像生成工具，它更像是一位精通图像处理的AI助手。它通过指令化和上下文感知的内容填充技术，实现了高质量的图像创作和编辑功能。ACE++提供多种模型，针对不同任务进行了优化：

技术解析：LCU++与两阶段训练方案

ACE++的技术核心在于其改进的长上下文条件单元（LCU++）和两阶段训练方案。

LCU++： 传统的图像生成模型通常采用序列拼接的方式处理输入信息。而ACE++提出的LCU++输入范式，通过将输入图像、掩码和噪声在通道维度上进行拼接，形成条件单元（CU）特征图。这种改进减少了上下文感知框架的干扰，降低了模型适应成本，并增强了模型对不同任务的适应性。
两阶段训练方案： ACE++采用两阶段训练方案。第一阶段，模型基于文本到图像模型进行预训练，专注于 0-ref 任务，基于基础模型的生成能力快速适应条件输入。第二阶段，模型在所有数据上进行微调，支持通用指令，同时优化模型对输入参考图像的重建能力和目标图像的生成能力。

应用场景：从虚拟试穿到艺术创作

ACE++的应用场景十分广泛，涵盖了多个行业：

未来展望：指令化图像处理的无限可能

ACE++的发布，不仅是阿里巴巴在AI领域的又一次重要突破，也预示着图像生成与编辑领域将迎来指令化的新时代。随着技术的不断发展，我们有理由相信，ACE++将在更多领域发挥重要作用，为人们的生活和工作带来更多便利和惊喜。

项目地址：

参考文献：

Ali-Vilab. (2024). ACE++. Retrieved from https://ali-vilab.github.io/ACE_plus
Ali-Vilab. (2024). ACE++ Github Repository. Retrieved from https://github.com/ali-vilab/ACE_plus
Ali-Vilab. (2024). ACE++ HuggingFace Model. Retrieved from https://huggingface.co/ali-vilab/ACE_Plus
Ali-Vilab. (2025). ACE++ arXiv Paper. Retrieved from https://arxiv.org/pdf/2501.02487

（完）

>>> Read more <<<