Stability AI 开源 Stable Diffusion 3 Medium,文本生成图像模型再升级
北京时间6月12日晚间消息,人工智能初创公司 Stability AI 宣布正式开源发布其最新的文本到图像生成模型——Stable Diffusion 3 Medium(SD3 Medium)。该模型包含 20 亿个参数,是 Stability AI 迄今为止最先进的文本到图像开放模型,更小的 VRAM 占用空间旨在使其更适合在消费级 GPU 以及企业级 GPU 上运行。
SD3 Medium 的主要特点:
- 先进性: SD3 Medium 拥有 20 亿个参数,是 Stability AI 迄今为止最为复杂的图像生成模型,代表了生成式 AI 进化的重要里程碑。
- 适用性: 这一模型的尺寸适中,使其成为在消费级 PC、笔记本电脑以及企业级 GPU 上运行的理想选择,有望成为文本到图像模型的新标准。
- 开放性: SD3 Medium 的权重现已在非商业许可和低成本创作者许可下开放,鼓励专业艺术家、设计师、开发者和 AI 爱好者进行商业使用。
- 多平台支持: 支持API 试用,可在 Stability 平台、Stable Assistant(免费三天试用)和通过 Discord 的 Stable Artisan 上尝试。
SD3 Medium 的改进:
- 照片级真实感: SD3 Medium 通过减少手部和面部的常见伪影,提供无需复杂工作流程即可生成的高质量图像。
- 提示遵循: 模型能够理解并生成涉及空间关系、构图元素、动作和风格的复杂提示。
- 排版能力: 借助 Diffusion Transformer 架构,SD3 Medium 在生成文本时实现了无伪影和拼写错误。
- 资源效率:模型设计考虑了资源效率,即使在标准消费级 GPU 上也能保持高性能,不牺牲性能。
- 微调能力: SD3 Medium 能够从小数据集中吸收细节,为定制化提供了强大支持。
合作伙伴:
- NVIDIA: Stability AI 与 NVIDIA 的合作,通过 NVIDIA® RTX™ GPU 和 TensorRT™,为所有 Stable Diffusion 模型,包括 SD3 Medium,提供了性能上的显著提升。
- AMD: AMD 对 SD3 Medium 进行了优化,确保在 AMD 的最新 APU、消费级 GPU 和 MI-300X 企业级 GPU 上提供高效推理。
开放与安全:
Stability AI 坚定地致力于开放的生成性 AI,SD3 Medium 在 Stability NonCommercial Research Community License 下发布,同时推出了新的 Creator License,以支持商业用途。 公司采取了全面的安全措施,从模型训练到部署,确保了SD3 Medium 的安全和负责任的使用。
未来计划:
Stability AI 计划根据用户反馈持续改进 SD3 Medium,扩展其功能,提高性能。公司的目标是为 AI 生成艺术设定新的标准,使 SD3 Medium 成为专业人士和爱好者的重要工具。
此次开源发布标志着文本生成图像模型领域又迈出了重要一步。 SD3 Medium 的出现将进一步推动 AI 生成艺术的发展,为艺术家、设计师和开发者提供更强大的工具,创造出更加逼真、精美的图像作品。 同时,Stability AI 的开放性策略也为 AI 技术的普及和应用提供了新的可能性。 相信随着技术的不断进步,AI 生成图像将会在未来发挥更加重要的作用,为人们的生活带来更多便利和惊喜。
【source】https://ai-bot.cn/stable-diffusion-3-medium/
Views: 1