书生·物华2.0：AI打造3D世界

作者智能小编

10 月 14, 2024 #3D, #每日AI快讯, #物华

书生·物华2.0：三维物体生成大模型的突破

上海人工智能实验室与南洋理工大学联合推出的书生·物华2.0（3DTopia 2.0）三维物体生成大模型，为游戏、影视、建筑和设计等行业带来了革命性的变革。这款模型基于创新的PrimX表示方法，能够将形状、纹理和材质信息编码为紧凑的张量格式，实现高分辨率几何图形的建模。

书生·物华2.0的独特之处在于其多模态输入能力。 它能够根据文本描述或图像输入，快速生成对应的三维模型。模型采用Diffusion Transformer框架，支持从随机噪声中逐步去除噪声，生成符合输入条件的潜在原语标记，从而实现高效的生成过程。

模型的优势不仅体现在效率上，更体现在生成质量上。 书生·物华2.0能够生成具有平滑几何形状和空间变化的纹理和材质的三维物体，接近真实物理材质感。此外，模型生成的模型可以直接用于游戏引擎和工业设计软件，无需额外处理。

书生·物华2.0的技术原理基于PrimX表示法和潜在原语扩散技术。 PrimX表示法将三维物体的形状、反照率和材质信息编码到一个紧凑的张量格式中，每个原语都是一个小体素，通过其三维位置、全局缩放因子和对应的空间变化的有效载荷来参数化。潜在原语扩散技术则利用Diffusion Transformer框架，学习如何从随机噪声中逐步去除噪声，生成符合输入条件的潜在原语标记。

书生·物华2.0的应用场景非常广泛， 包括：