北京 – 阿里巴巴通义实验室近日正式推出其升级版图像生成与编辑模型ACE++,标志着AI在图像处理领域又向前迈出了重要一步。这款工具不仅能够根据用户的指令生成高质量图像,还能对现有图像进行精细化编辑,为设计、电商、娱乐等行业带来了全新的可能性。
ACE++:不止是图像生成,更是智能编辑
ACE++并非简单的图像生成工具,它更像是一位精通图像处理的AI助手。它通过指令化和上下文感知的内容填充技术,实现了高质量的图像创作和编辑功能。ACE++提供多种模型,针对不同任务进行了优化:
- ACE++ Portrait: 专注于生成一致的人物肖像,确保面部特征和风格的统一。
- ACE++ Subject: 能够在不同场景中保持主题的一致性,例如将某个标志或物体放置在不同的背景中。
- ACE++ LocalEditing: 允许用户重新绘制图像的特定区域,同时保留原有结构,实现精细化的局部编辑。
- ACE++ Fully (即将推出): 预计将支持更多指令化编辑和参考生成任务,进一步拓展ACE++的应用范围。
技术解析:LCU++与两阶段训练方案
ACE++的技术核心在于其改进的长上下文条件单元(LCU++)和两阶段训练方案。
- LCU++: 传统的图像生成模型通常采用序列拼接的方式处理输入信息。而ACE++提出的LCU++输入范式,通过将输入图像、掩码和噪声在通道维度上进行拼接,形成条件单元(CU)特征图。这种改进减少了上下文感知框架的干扰,降低了模型适应成本,并增强了模型对不同任务的适应性。
- 两阶段训练方案: ACE++采用两阶段训练方案。第一阶段,模型基于文本到图像模型进行预训练,专注于 0-ref 任务,基于基础模型的生成能力快速适应条件输入。第二阶段,模型在所有数据上进行微调,支持通用指令,同时优化模型对输入参考图像的重建能力和目标图像的生成能力。
应用场景:从虚拟试穿到艺术创作
ACE++的应用场景十分广泛,涵盖了多个行业:
- 虚拟试穿: ACE++ Subject模型可以帮助用户将服装或配饰放置在不同的人物模型上,实现虚拟试穿效果,为电商平台提供个性化的试穿体验。
- 品牌标志粘贴: 在产品设计或广告制作中,ACE++ Subject模型可以将品牌标志或设计元素嵌入到不同的背景或物品上,提升品牌形象。
- 照片编辑: ACE++支持对现有照片进行多种编辑操作,包括风格转换、元素添加或删除、背景替换等,满足用户多样化的照片处理需求。
- 电影海报编辑: ACE++ Portrait模型可以对电影海报中的人物肖像进行风格化处理或修改,为电影宣传提供更多创意空间。
- 局部编辑: ACE++ LocalEditing模型能对图像的特定区域进行重新绘制或修改,同时保留原有图像的结构和风格,实现精细化的图像修复和美化。
- 艺术创作与设计: 艺术家和设计师可以用ACE++的生成和编辑功能,快速实现创意构想,提升创作效率。
未来展望:指令化图像处理的无限可能
ACE++的发布,不仅是阿里巴巴在AI领域的又一次重要突破,也预示着图像生成与编辑领域将迎来指令化的新时代。随着技术的不断发展,我们有理由相信,ACE++将在更多领域发挥重要作用,为人们的生活和工作带来更多便利和惊喜。
项目地址:
- 项目官网:https://ali-vilab.github.io/ACE_plus
- Github仓库:https://github.com/ali-vilab/ACE_plus
- HuggingFace模型库:https://huggingface.co/ali-vilab/ACE_Plus
- arXiv技术论文:https://arxiv.org/pdf/2501.02487
参考文献:
- Ali-Vilab. (2024). ACE++. Retrieved from https://ali-vilab.github.io/ACE_plus
- Ali-Vilab. (2024). ACE++ Github Repository. Retrieved from https://github.com/ali-vilab/ACE_plus
- Ali-Vilab. (2024). ACE++ HuggingFace Model. Retrieved from https://huggingface.co/ali-vilab/ACE_Plus
- Ali-Vilab. (2025). ACE++ arXiv Paper. Retrieved from https://arxiv.org/pdf/2501.02487
(完)
Views: 0