北京报道 – 2024年5月15日 – 腾讯近日正式推出其最新研发成果——Hunyuan3D 2.0,一款大规模3D资产生成系统。该系统旨在通过人工智能技术,大幅提升3D模型创建的效率和质量,为游戏开发、UGC社交、电商、工业制造、地图导航等多个行业带来革新。
Hunyuan3D 2.0的核心在于其两阶段生成流程,将复杂的3D模型生成过程分解为几何模型生成和纹理合成两个独立环节。这一创新设计有效降低了技术难度,并为用户提供了更大的灵活性。
技术解析:几何与纹理的完美结合
Hunyuan3D 2.0包含两个关键组件:
- Hunyuan3D-DiT (几何生成模型): 基于流扩散的扩散模型,能够根据输入的图像精确生成匹配的几何模型。该模型通过Hunyuan3D-ShapeVAE将3D形状编码为连续的潜码,再利用双流和单流的Transformer架构进行扩散模型训练,确保了生成的几何形状的准确性和精细度。
- Hunyuan3D-Paint (纹理合成模型): 凭借强大的几何和扩散先验知识,该模型能够为生成的或手工制作的网格模型生成高分辨率且逼真的纹理贴图。它采用多视图扩散生成方案,结合法线图和位置图等几何条件,生成多视图图像,并将其烘焙为高分辨率纹理,从而赋予3D模型生动的视觉效果。
开源模型:助力行业发展
为了推动3D技术的发展和应用,腾讯还开源了一系列Hunyuan3D 2.0相关的模型,包括:
- Hunyuan3D-2mv: 多视角形状生成模型,专注于通过多视角输入生成高质量的3D几何形状。
- Hunyuan3D-2mini: Hunyuan3D-2mv的简化版本,更适合轻量级应用。
- Hunyuan3D-DiT-v2-0: 大规模几何生成模型,用于从图像生成高保真度的无纹理几何模型,参数量高达26亿。
- Hunyuan3D-Paint-v2-0: 大规模纹理生成模型,用于为几何模型生成高分辨率且逼真的纹理贴图,参数量为13亿。
- Hunyuan3D-Delight-v2-0: 图像去光影模型,用于将输入图像转换为无光影状态,生成光照不变的纹理贴图。
- Hunyuan3D-DiT-v2-0-Fast: 加速版本的几何生成模型,通过指导蒸馏技术缩短推理时间,适用于对生成速度有更高要求的场景。
应用场景:赋能各行各业
Hunyuan3D 2.0的应用潜力巨大,涵盖了多个领域:
- 游戏开发: 快速生成高质量的3D游戏资产,如角色、道具和场景,显著提升开发效率。
- UGC社交与内容创作: 用户可以通过文本描述、图片或草图快速生成个性化的3D模型,如个人3D形象、虚拟礼物等。
- 电商与广告: 根据商品图片快速生成高精度的3D商品模型,用于线上展示和交互,提升用户体验。
- 工业制造与设计: 根据设计草图或概念图快速生成3D工业产品原型,用于设计验证和展示。
- 地图导航: 腾讯地图已基于Hunyuan3D 2.0推出自定义3D导航车标功能,创作效率提升了91%。
- 教育与科研: 提供开源模型和代码,方便教育工作者和科研人员进行教学和研究。
未来展望:3D技术的普及与创新
Hunyuan3D 2.0的发布,标志着腾讯在人工智能驱动的3D内容生成领域迈出了重要一步。通过开源模型和强大的技术支持,Hunyuan3D 2.0有望加速3D技术的普及和创新,为各行各业带来更高效、更便捷的3D内容创作体验。
项目地址:
- 项目官网:3d-models.hunyuan.tencent.com
- Github仓库:https://github.com/Tencent/Hunyuan3D-2
- HuggingFace模型库:https://huggingface.co/tencent/Hunyuan3D-2
参考文献:
- Tencent Hunyuan3D 2.0 Official Website. (2024). Retrieved from 3d-models.hunyuan.tencent.com
- Tencent Hunyuan3D 2.0 GitHub Repository. (2024). Retrieved from https://github.com/Tencent/Hunyuan3D-2
- Tencent Hunyuan3D 2.0 HuggingFace Model Hub. (2024). Retrieved from https://huggingface.co/tencent/Hunyuan3D-2
Views: 0