谷歌 Imagen 3 文生图 AI 模型正式开放,力压 DALL-E 3 等顶级模型
IT之家 8 月16 日消息,科技媒体 VentureBeat 报道,谷歌已经向美国用户正式开放了最新文生图 AI 模型 Imagen 3,用户可以打开 AI Test Kitchen 体验该功能。官方称最新版本“细节更清晰、光照更丰富、干扰性人工痕迹更少”。
谷歌于今年 5 月召开的 I/O 开发者大会上宣布 Imagen 3 模型,6 月邀请部分 Vertex AI 用户测试使用,而现在正式向美国用户开放。
Imagen 3 性能超越 DALL-E 3 等竞争对手
谷歌人工智能研究部门 DeepMind 负责人德米斯・哈萨比斯(Demis Hassabis)表示,与前代产品 Imagen 2 相比,Imagen 3能更准确地理解文字提示,并将其转化为图像,而且其生成的图像更具“创造性和细节”,且模型产生的干扰元素和错误也更少。
在谷歌的人工和自动评估中,Imagen 3 的表现优于 Imagen 2、DALL-E 3、Midjourney v6、Stable Diffusion 3 和 Stable Diffusion XL 1.0。Imagen 3 在将文本描述与生成的图像相匹配以及处理详细提示方面表现尤为突出。
Imagen 3 的优势
Imagen 3 的优势主要体现在以下几个方面:
- 更清晰的细节: Imagen 3 生成的图像细节更加丰富,能够更好地还原用户在文字提示中描述的场景和物体。
- 更丰富的光照: Imagen 3 能够更准确地模拟光照效果,使生成的图像更加逼真。
- 更少的人工痕迹: Imagen 3 减少了图像中的人工痕迹,使生成的图像更加自然。
- 更强的理解能力: Imagen 3 能够更准确地理解用户在文字提示中的意图,并将其转化为图像。
Imagen 3 的开放意味着什么?
Imagen 3 的开放意味着文生图 AI 技术正在不断发展,并逐渐走向成熟。这将为用户提供更多更强大的工具,帮助他们进行图像创作和设计。
未来展望
随着文生图 AI 技术的不断发展,我们可以期待未来出现更加强大、更加智能的 AI 模型。这些模型将能够更好地理解用户需求,并生成更加逼真、更加精美的图像。
总结
谷歌 Imagen 3 文生图 AI 模型的开放,标志着文生图 AI 技术迈上了新的台阶。Imagen 3 的强大性能和丰富的功能,将为用户带来全新的图像创作体验。相信随着技术的不断发展,文生图 AI 技术将为我们的生活带来更多惊喜。
Views: 0