Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

shanghaishanghai
0

上海科大联合华中科大等推出TANGLED:突破3D发型生成技术瓶颈,赋能文化包容性数字角色创建

引言:数字角色的“头等大事”

在数字时代,虚拟人物已经渗透到我们生活的方方面面,从游戏、动画到增强现实、虚拟社交,高质量的数字角色需求日益增长。而发型,作为人物形象的重要组成部分,其真实感和多样性直接影响着数字角色的表现力。然而,长期以来,3D发型生成一直是计算机图形学领域的一大挑战。传统方法往往难以处理复杂发型,尤其是在文化包容性方面存在明显不足,难以满足日益增长的多元化需求。

近日,上海科技大学、Deemos Technology和华中科技大学联合推出了一项名为TANGLED的创新技术,为3D发型生成领域带来了突破性的进展。TANGLED不仅能够从任意风格和视角的图像中生成高质量的3D发丝,更重要的是,它在发型的真实感、多样性和文化包容性方面实现了显著提升,为动画、增强现实等领域提供了新的应用可能性。

TANGLED:技术原理与核心优势

TANGLED的核心在于其巧妙结合了多样化的数据集、基于多视图线稿的扩散框架以及参数化后处理模块,从而实现了对复杂发型的精确建模和渲染。

  1. NeuraPressMultiHair数据集:多样性与文化包容性的基石

传统发型数据集往往缺乏多样性,尤其是在卷曲、辫子等复杂发型以及具有文化意义的发型方面存在明显不足。为了解决这一问题,TANGLED团队构建了NeuraPressMultiHair数据集,该数据集包含了457种多样化的发型,并标注了74个属性。

  • 多样性: 数据集涵盖了各种发型风格,包括直发、卷发、辫子、盘发等,以及不同长度、颜色和密度的发型。
  • 文化包容性: 数据集特别关注未被充分代表的发型纹理(如卷曲、辫子)和复杂几何结构,收录了大量具有文化意义的发型,如非洲辫、中国结等。
  • 详细标注: 数据集中的每个发型都标注了74个属性,包括发型类型、长度、颜色、密度、卷曲度、辫子数量、分界线位置等,为模型的训练提供了丰富的监督信息。
  • 数据增强: 为了进一步增强数据集的多样性,TANGLED团队采用了多视图渲染和线稿提取等技术,从不同角度和风格生成同一发型的多个变体。此外,团队还利用GPT-4生成了详细的文本标注,为模型的训练提供了更全面的信息。

NeuraPressMultiHair数据集的构建为TANGLED在发型多样性和文化包容性方面的突破奠定了坚实的基础。

  1. 基于多视图线稿的扩散框架:捕捉发型的拓扑结构

扩散模型在图像生成领域取得了显著的成果,但将其应用于3D发型生成仍然面临着挑战。TANGLED团队巧妙地利用多视图线稿作为扩散模型的输入,从而有效地捕捉发型的拓扑结构。

  • 线稿特征: 线稿能够简洁地表达发型的结构信息,如发丝的走向、分界线的位置、辫子的形状等。
  • 多视图输入: 通过从不同视角获取发型的线稿,可以更全面地了解发型的三维结构。
  • DINOv2特征提取: TANGLED团队利用DINOv2模型提取线稿特征,DINOv2是一种强大的自监督视觉特征提取器,能够有效地捕捉图像中的语义信息。
  • 交叉注意力机制: TANGLED团队设计了一种交叉注意力机制,将不同视角的线稿特征整合到扩散模型中。交叉注意力机制能够学习不同视角线稿特征之间的关系,从而生成更一致和准确的3D发型。
  • 随机混合: 为了增强模型对不同输入风格和视角的适应性,TANGLED团队在训练过程中随机混合不同视角的线稿特征。

基于多视图线稿的扩散框架使得TANGLED能够有效地捕捉发型的拓扑结构,从而生成更真实和自然的3D发型。

  1. 参数化后处理模块:修复复杂发型的细节

对于辫子等复杂发型,扩散模型往往难以生成精细的细节。为了解决这一问题,TANGLED团队设计了一种参数化后处理模块,专门用于修复复杂发型的细节。

  • Frenet-Serret框架: TANGLED团队利用Frenet-Serret框架生成辫子的几何结构。Frenet-Serret框架是一种描述曲线局部性质的数学工具,可以精确地控制辫子的形状和走向。
  • 注意力机制: TANGLED团队利用注意力机制将生成的辫子几何结构自然地融入发型中。注意力机制能够学习辫子与周围发丝之间的关系,从而生成更自然的过渡效果。
  • Laplacian平滑: 为了减少高频率噪声,确保发型的几何连贯性和视觉效果,TANGLED团队采用了Laplacian平滑技术。

参数化后处理模块使得TANGLED能够生成具有精细细节的复杂发型,从而进一步提升了发型的真实感和多样性.

TANGLED的主要功能与应用场景

TANGLED凭借其独特的技术优势,实现了多种强大的功能,并为多个领域带来了新的应用可能性。

  1. 多样化发型生成: TANGLED能够处理各种复杂发型,如辫子、卷发、传统发型等,满足不同用户的需求。
  2. 多视图输入支持: TANGLED接受单视图或多视图图像作为输入,具有很强的灵活性。
  3. 灵活的输入风格: TANGLED支持多种输入风格,包括照片、手绘草图、卡通和油画等,满足不同应用场景的需求。
  4. 文化包容性: TANGLED特别关注未被充分代表的发型纹理和复杂几何结构,支持生成具有文化意义的发型,促进文化交流和理解。
  5. 高效集成: TANGLED生成的3D发型能够直接集成到现有的CG流程中,如Blender和Unreal Engine,方便用户使用。

基于以上功能,TANGLED在以下领域具有广阔的应用前景:

  • 文化包容性虚拟人物创建: TANGLED能够生成多样化发型,支持不同文化背景的虚拟人物设计,促进文化交流和理解。
  • 动画发型设计: TANGLED能够从草图生成3D发型,提升动画制作效率,降低制作成本。
  • 增强现实(AR)发型预览: TANGLED结合AR技术,让用户虚拟试戴不同发型,提升用户体验。
  • 虚拟试妆应用: TANGLED帮助用户在购买前预览发型效果,减少购买风险。
  • 基于草图的3D发丝编辑: TANGLED支持基于修改草图快速调整发型,适用于创意设计领域。

TANGLED的意义与影响

TANGLED的推出是3D发型生成领域的一项重要突破,它不仅提升了发型的真实感和多样性,更重要的是,它在文化包容性方面取得了显著进展。

  • 技术创新: TANGLED巧妙地结合了多样化的数据集、基于多视图线稿的扩散框架以及参数化后处理模块,为3D发型生成领域提供了新的思路和方法。
  • 文化价值: TANGLED特别关注未被充分代表的发型纹理和复杂几何结构,支持生成具有文化意义的发型,促进文化交流和理解,有助于打破刻板印象,增强文化自信。
  • 产业推动: TANGLED的应用将推动动画、增强现实、虚拟试妆等相关产业的发展,为数字内容创作带来新的活力。

结语:展望未来

TANGLED的成功是上海科技大学、Deemos Technology和华中科技大学科研团队共同努力的结晶,它代表了中国在人工智能领域的创新实力。随着技术的不断发展,我们有理由相信,未来的3D发型生成技术将更加成熟和完善,为数字世界带来更加丰富多彩的人物形象。

TANGLED的发布不仅是一项技术成果,更是一种文化责任的体现。它提醒我们,在追求技术进步的同时,也要关注文化多样性,尊重不同文化背景的个体,共同构建一个更加包容和美好的数字世界。

参考文献


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注