交大华为联手，FluxSR重塑图像清晰度！

上海，[日期] – 上海交通大学联合华为等高校，近日推出了一款名为FluxSR的图像超分辨率模型，该模型基于新型单步扩散模型，专为真实世界图像超分辨率（Real-ISR）任务设计。这一创新成果有望在老旧照片修复、影视制作、医学影像增强等多个领域带来突破性进展。

图像超分辨率技术旨在将低分辨率图像恢复为高分辨率图像，长期以来一直是计算机视觉领域的研究热点。传统的超分辨率方法往往面临计算成本高、细节恢复不足等问题。而FluxSR的出现，为解决这些难题提供了一种全新的思路。

FluxSR的核心在于其采用的流轨迹蒸馏（FTD）技术。该技术基于FLUX.1-dev文本到图像（T2I）扩散模型，通过将多步流匹配模型蒸馏为单步超分辨率模型，实现了在保持T2I模型高真实感的同时，高效生成高质量的超分辨率图像。

技术亮点：

高效单步超分辨率重建： FluxSR在单步扩散过程中即可将低分辨率图像高效地恢复为高分辨率图像，显著减少了计算成本和推理延迟，使其更适合快速图像处理需求。
高真实感图像生成： 模型从预训练的文本到图像（T2I）模型中提取高真实感细节，并将其应用于超分辨率任务，最终生成具有丰富细节和高真实感的图像。
高频细节恢复与伪影抑制： FluxSR能够有效恢复图像的高频细节，同时减少高频伪影和重复模式，从而提升图像的视觉质量。
流轨迹蒸馏（FTD）： 通过预训练的T2I模型生成噪声到图像的流，并基于数学关系推导出低分辨率到高分辨率的流轨迹，避免了直接优化SR流导致的分布偏移。
感知损失和正则化： 模型采用TV-LPIPS感知损失和注意力多样化损失（ADL）优化图像高频细节，减少伪影。TV-LPIPS感知损失结合了总变差（TV）和LPIPS（Learned Perceptual Image Patch Similarity）损失，强调高频分量的恢复。注意力多样化损失（ADL）则通过减少变换器中不同token的相似性，增强注意力的多样性，消除高频伪影。

应用前景广阔：

FluxSR的应用场景十分广泛，包括：

学术与产业的强强联合：

FluxSR的成功推出，是上海交通大学、哈佛大学、华南理工大学和华为诺亚方舟实验室等多方合作的结晶。这一成果不仅体现了学术界在人工智能领域的创新能力，也展示了产业界对前沿技术的积极探索和应用。

项目地址：

感兴趣的读者可以通过以下链接了解更多关于FluxSR的信息：

未来展望：

随着人工智能技术的不断发展，图像超分辨率技术将在更多领域发挥重要作用。FluxSR的推出，无疑为这一领域注入了新的活力。未来，我们期待看到更多基于FluxSR的创新应用，为人们的生活带来更多便利。

参考文献：

Li, J., et al. (2024). FluxSR: Single-Step Diffusion Model for Real-World Image Super-Resolution. arXiv preprint arXiv:2502.01993.

注：由于提供的论文链接为虚构，请在实际使用时替换为真实链接。