“`markdown
美图CVPR 2025斩获五项突破:国民APP背后的AI黑科技揭秘
北京,[日期] – 在计算机视觉领域备受瞩目的国际顶级会议CVPR(国际计算机视觉与模式识别会议)2025上,中国国民级应用美图公司旗下美图影像研究院(MT Lab)传来喜讯,其联合清华大学、新加坡国立大学等知名高校的五篇论文成功入选。这些论文均聚焦于图像编辑领域,涵盖生成式AI、交互式分割和3D重建三大方向,展现了美图在AI技术研发方面的强大实力和持续创新能力。
CVPR 2025的投稿量再创新高,超过13000篇,但录用比例仅为22.1%,竞争异常激烈。美图能够在如此高压的环境下脱颖而出,充分证明了其在计算机视觉领域的领先地位。
AI驱动产品力提升,用户粘性与付费意愿双增长
美图在研发方面的突破,不仅代表着其在核心视觉领域竞争力的持续提升,更重要的是,AI技术的赋能正推动美图产品力的飞跃,并直接转化为更高的用户粘性和付费意愿。美图深度结合前沿技术与可落地的实用价值,已成为其在影像与设计领域打造AI产品的核心驱动力。
三大技术路径解析:精细化、垂类创新、高质量合成
美图此次在CVPR 2025上取得的突破,主要体现在以下三个技术路径上:
-
精细化策略设计: 美图通过结合精细化策略,例如基于点击的交互式分割方法NTClick和两阶段细化框架SAM-REF,显著提高了交互分割的效率与精度,同时大幅降低了用户操作复杂度。这意味着用户可以更加轻松、精准地对图像进行编辑和处理。
-
垂类场景下基于扩散模型的框架创新: 美图在特定编码器结合下,提升了生成任务的质量。此外,基于多任务训练框架,提升了结构稳定性和风格一致性。这一创新使得美图在图像生成方面能够更好地满足用户的个性化需求。
-
外推视角的高质量合成: 美图基于增强视图先验引导的方案,成功实现了高保真的3D重建。这项技术为新视角生成、增强现实(AR)、3D内容生成、虚拟数字人等领域带来了新的可能性。
明星技术落地应用:美图秀秀无痕改字与美图设计室
此次入选CVPR的GlyphMastero技术,已成功落地于美图旗下产品美图秀秀的无痕改字功能,为用户提供了更加轻松便捷的改字体验。该技术通过创新的字形编码器,能够捕捉局部单个字符的笔画关系以及字符间的全局排布,从而实现对场景文本生成过程的精确控制。实验结果表明,GlyphMastero在句子准确率上提高了18.02%,同时将文本区域风格相似度距离(FID)降低了53.28%,生成文本实现了更加自然且高融合度的视觉风格。
另一项关键技术,交互分割,则带动了旗下产品美图设计室的亮眼表现。美图设计室被称为“电商人必备的AI设计工具”,凭借在交互分割方面的领先优势,2024年单产品收入约2亿元,按年同比翻倍,是美图有史以来收入增长最快的产品。
3D重建技术潜力无限:EVPGS助力行业发展
受益于深度学习的驱动,尤其是高斯泼溅(Gaussian Splatting)的兴起,3D重建在新视角生成、增强现实(AR)、3D内容生成、虚拟数字人等领域应用需求激增。美图的EVPGS技术在多个行业展现出强大的潜力,有望推动相关领域的快速发展。
结语:AI赋能,美图持续领跑影像与设计领域
美图在CVPR 2025上取得的五项突破,不仅展现了其在AI技术研发方面的雄厚实力,更预示着其在影像与设计领域将迎来更加广阔的发展前景。随着AI技术的不断进步和应用,美图有望继续引领行业创新,为用户带来更加优质、便捷的产品和服务。
参考文献:
- CVPR 2025官方网站:[此处应为CVPR 2025官方网站链接,由于是假设年份,此处留空]
- 美图公司官方网站:https://www.meitu.com/
- 机器之心相关报道:[此处应为机器之心相关报道链接,由于是基于提供的文本生成,此处留空]
(完)
“`
Views: 0