Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

上海报道 – 在人工智能与设计领域融合的大潮中,复旦大学与StepFun携手推出了一款名为OmniSVG的创新型AI模型,为矢量图形的生成方式带来了颠覆性的变革。这款端到端多模态模型,不仅是全球首个能够直接生成可缩放矢量图形(SVG)的AI工具,更凭借其高效的训练方式、强大的多模态生成能力以及广泛的应用前景,引发了业界的广泛关注。

OmniSVG:矢量图形生成的全新范式

OmniSVG的核心在于其端到端的多模态生成能力。这意味着,用户可以通过文本描述、图像参考甚至角色参考等多种方式,直接生成高质量的SVG图形。与传统的矢量图形生成方法相比,OmniSVG无需繁琐的手动绘制,极大地简化了设计流程,降低了设计门槛。

该模型基于预训练的视觉语言模型(VLM)Qwen-VL构建,并采用了创新的SVG标记化方法。这种方法将SVG命令和坐标参数化为离散的令牌(tokens),通过类似自然语言处理的方式处理SVG的生成。通过将结构逻辑与几何细节解耦,OmniSVG不仅提高了训练效率,还保留了生成复杂SVG结构的能力。

技术突破:效率与细节的完美平衡

OmniSVG的技术突破体现在多个方面:

  • 高效训练: 相比传统方法,OmniSVG的训练速度提升了3倍以上,这得益于其独特的SVG标记化方法。
  • 长序列处理: OmniSVG能够处理长达30,000个令牌的序列,这意味着它可以生成包含丰富细节的复杂SVG图形。
  • 多模态生成: 支持从文本描述、图像参考或角色参考等多种输入方式直接生成SVG图形,满足了不同用户的需求。

MMSVG-2M数据集与MMSVG-Bench评估协议

为了支持OmniSVG的研发和评估,复旦大学与StepFun团队还发布了MMSVG-2M数据集。该数据集包含了200万个带多模态标注的SVG资源,涵盖图标、插图和角色三大子集。同时,团队还提出了标准化的评估协议MMSVG-Bench,用于测试条件SVG生成任务的性能。

广泛的应用场景:赋能设计与开发

OmniSVG的应用场景十分广泛,涵盖了品牌图标设计、网页开发、游戏开发、快速原型设计等多个领域:

  • 品牌图标设计: 设计师可以通过文本描述快速生成品牌图标,大大减少了手动设计时间。
  • 网页开发: OmniSVG可以根据文本描述或图像参考生成矢量图标,图标可以无损缩放,适用于从移动设备到4K显示器的多种分辨率。
  • 游戏开发: OmniSVG可以用于生成游戏角色、场景等图形素材,为游戏增添独特的艺术风格。
  • 快速原型设计: 内容创作者可以用OmniSVG快速生成图标、插图或角色图形的原型,加速创作流程。

此外,生成的SVG文件具有无限可缩放性和完全可编辑性,能够无缝集成到Adobe Illustrator等专业设计工作流程中,进一步提高了AI生成图形在图形设计、网页开发等领域的实用性。

项目地址与资源

感兴趣的开发者和研究人员可以通过以下链接了解更多关于OmniSVG的信息:

结语

OmniSVG的发布,标志着AI在矢量图形生成领域取得了重要突破。它不仅为设计师和开发者提供了更高效、更便捷的工具,也为AI与设计的融合开辟了新的可能性。随着技术的不断发展,我们有理由相信,OmniSVG将在未来的设计领域发挥更加重要的作用。

参考文献


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注