Sora添新翼？OpenAI或推图像生成，DALL-E 4在路上？

北京，2025年2月9日 – 人工智能领域再次迎来激动人心的时刻。据可靠消息，OpenAI正在内部测试其革命性的视频生成模型Sora的图像生成功能，项目代号为“Papaya”。这一举动引发了业界对于DALL-E 4即将问世的强烈猜测，预示着OpenAI在图像生成领域即将迎来一次重大升级。

Sora的图像生成功能：内部测试揭秘

自Sora首次亮相以来，其强大的视频生成能力便震撼了整个科技界。然而，OpenAI似乎并不满足于此，正在积极探索Sora在图像生成方面的潜力。

内部测试显示，OpenAI正在Sora的界面中集成一个隐藏的切换按钮，允许用户在视频和图像生成模式之间无缝切换。当用户选择图像生成模式时，提示栏的描述将相应地调整，引导用户输入图像描述，从而生成符合要求的图像。

这一功能的加入，无疑将极大地拓展Sora的应用场景，使其不仅能够生成逼真的视频，还能创作出令人惊叹的静态图像。这对于设计师、艺术家、营销人员以及其他需要高质量视觉内容的专业人士来说，无疑是一个巨大的福音。

Sora视频推送改版：优化用户体验

除了图像生成功能，OpenAI还对Sora的视频推送进行了重大改版，将其分为“Best”和“Top”两个类别。

“Best”类别很可能与目前Sora的特色频道类似，展示由OpenAI官方精选的优质视频内容。这些视频通常具有较高的艺术价值、技术水平或创意性，旨在为用户提供灵感和参考。

而“Top”类别则更具创新性，它可能允许用户按照时间段进行筛选，并根据点赞数或其他标准对视频进行排名。这意味着用户可以轻松地找到在特定时间内最受欢迎、最具影响力的Sora视频作品。

通过这种分类方式，OpenAI旨在优化用户体验，让用户能够更高效地发现和欣赏Sora生成的精彩内容。

DALL-E 3的挑战与DALL-E 4的期待

OpenAI此举引发了业界对于DALL-E 4的强烈期待。自DALL-E 3发布以来，已经过去了一年半的时间。尽管DALL-E 3在图像生成方面取得了显著的进展，但在某些方面，例如图像的细节处理和风格多样性方面，与竞争对手Midjourney相比仍存在一定的差距。

因此，许多人认为DALL-E 4的推出势在必行，它将有望在图像质量、生成速度、可控性以及风格多样性等方面实现全面提升，从而重新确立OpenAI在图像生成领域的领先地位。

“Papaya”代号的背后：Sora与DALL-E的融合？

值得注意的是，有消息称Sora中的文本到图像生成器代号为“Papaya”。这一代号的出现，引发了人们对于Sora与DALL-E之间关系的猜测。

一种可能性是，OpenAI正在尝试将Sora的视频生成技术与DALL-E的图像生成技术进行融合，从而打造一个更加强大、更加全面的AI内容创作平台。在这种情况下，“Papaya”可能代表着一种新的图像生成模型，它既具备DALL-E的图像质量，又拥有Sora的生成速度和可控性。

另一种可能性是，OpenAI计划将DALL-E 4集成到Sora平台中，使其成为Sora的一个重要组成部分。在这种情况下，“Papaya”可能只是DALL-E 4在Sora中的内部代号。

无论哪种可能性，都表明OpenAI正在积极探索图像生成技术的未来发展方向，并致力于为用户提供更加优质、更加便捷的AI内容创作工具。

Sora图像生成模型的猜想：sora-turbo还是GPT-4o？

目前，OpenAI尚未透露将由哪款模型提供Sora的图像生成功能。对此，业界提出了多种猜测。

一种猜测是，Sora的图像生成功能将由现有的“sora-turbo”模型驱动。该模型是Sora的核心组成部分，具备强大的视频生成能力。如果OpenAI能够成功地将“sora-turbo”模型应用于图像生成，那么Sora的图像生成能力将有望达到一个新的高度。

另一种猜测是，OpenAI可能会将GPT-4o的多模态图像生成功能集成到Sora中。GPT-4o是OpenAI最新发布的旗舰模型，具备强大的多模态处理能力，可以同时处理文本、图像和音频等多种类型的数据。如果OpenAI能够将GPT-4o的图像生成功能应用于Sora，那么Sora将有望实现更加逼真、更加自然的图像生成效果。

尚未在ChatGPT上看到GPT-4o的多模态图像生成功能

值得注意的是，尽管GPT-4o已经发布了一段时间，但我们尚未在ChatGPT上看到来自GPT-4o的多模态图像生成功能。这引发了人们对于OpenAI战略布局的思考。

一种可能性是，OpenAI正在优先将GPT-4o的多模态图像生成功能应用于Sora平台，以提升Sora的竞争力。另一种可能性是，OpenAI正在对GPT-4o的多模态图像生成功能进行进一步的优化和改进，以确保其能够在ChatGPT上提供最佳的用户体验。

无论如何，我们有理由相信，在不久的将来，我们一定能够在ChatGPT上体验到来自GPT-4o的强大多模态图像生成功能。

OpenAI的战略布局：AI内容创作平台的未来

OpenAI正在积极拓展其在AI内容创作领域的布局。从DALL-E到Sora，再到GPT-4o，OpenAI不断推出新的模型和功能，旨在为用户提供更加全面、更加便捷的AI内容创作工具。

通过将视频生成、图像生成和多模态处理等多种技术进行融合，OpenAI正在构建一个强大的AI内容创作平台，该平台将有望改变我们创作和消费内容的方式。

结论与展望

OpenAI内测Sora图像生成功能，代号“Papaya”，预示着DALL-E 4即将到来，这无疑是人工智能领域的一项重大进展。

Sora的图像生成功能将极大地拓展其应用场景，使其不仅能够生成逼真的视频，还能创作出令人惊叹的静态图像。Sora视频推送的改版将优化用户体验，让用户能够更高效地发现和欣赏Sora生成的精彩内容。

DALL-E 4的推出将有望在图像质量、生成速度、可控性以及风格多样性等方面实现全面提升，从而重新确立OpenAI在图像生成领域的领先地位。

OpenAI正在积极拓展其在AI内容创作领域的布局，构建一个强大的AI内容创作平台，该平台将有望改变我们创作和消费内容的方式。

未来，我们期待OpenAI能够继续推出更多创新性的AI技术和产品，为人类带来更加美好的未来。

参考文献：

TestingCatalog. (2025). OpenAI is internally testing image generation features for Sora. [Twitter post]. Retrieved from https://x.com/testingcatalog/status/1888256244063838527

致谢：

感谢机器之心提供的相关信息和报道。

（本文由[你的名字]撰写，仅代表个人观点，不代表任何机构或组织的立场。）

>>> Read more <<<

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Sora添新翼？OpenAI或推图像生成，DALL-E 4在路上？

作者智能小编

Sora的图像生成功能：内部测试揭秘

Sora视频推送改版：优化用户体验

DALL-E 3的挑战与DALL-E 4的期待

“Papaya”代号的背后：Sora与DALL-E的融合？

Sora图像生成模型的猜想：sora-turbo还是GPT-4o？

尚未在ChatGPT上看到GPT-4o的多模态图像生成功能

OpenAI的战略布局：AI内容创作平台的未来

结论与展望

相关文章

Sports Brands Go Big Outsizing Luxury with Mega-Stores

TikTok劲敌？两天MVP估值5亿，资本狂涌！

运动品牌“巨无霸”店来袭，奢侈品都得让路？

发表回复取消回复

为您推荐

Sports Brands Go Big Outsizing Luxury with Mega-Stores

TikTok劲敌？两天MVP估值5亿，资本狂涌！

运动品牌“巨无霸”店来袭，奢侈品都得让路？

Cloudflare Workers & Hyperdrive Supercharge Global MySQL App Performance

作者智能小编

Sora的图像生成功能：内部测试揭秘

Sora视频推送改版：优化用户体验

DALL-E 3的挑战与DALL-E 4的期待

“Papaya”代号的背后：Sora与DALL-E的融合？

Sora图像生成模型的猜想：sora-turbo还是GPT-4o？

尚未在ChatGPT上看到GPT-4o的多模态图像生成功能

OpenAI的战略布局：AI内容创作平台的未来

结论与展望

相关文章

发表回复 取消回复

为您推荐

发表回复取消回复