旧金山 — 近日,社交媒体被一波“吉卜力”风格的图像和视频刷屏,这股风潮的背后,是 OpenAI 最新推出的 GPT-4o 模型在图像生成方面的革新。更令人关注的是,与以往相比,GPT-4o 在内容限制方面似乎有所放宽,包括马斯克、特朗普等公众人物的图像现在也可以生成,而此前,这类请求往往会被模型直接拒绝。
这一变化引发了广泛关注,OpenAI 的模型行为负责人 Joanne Jang 在社交媒体上对此进行了解释。她表示,OpenAI 正在调整策略,从对敏感领域的全面拒绝转向更精确的方法,专注于防止现实世界的伤害。
Jang 强调,OpenAI 的目标是保持谦逊,认识到自身知识的局限性,并随着学习不断适应。她指出,图像具有独特而强大的影响力,能够超越语言障碍,唤起各种情感反应。因此,OpenAI 在制定图像生成方面的政策时,承担了比其他领域更重的责任。
策略演变:从全面限制到精细化管理
Jang 详细阐述了 OpenAI 在图像生成策略上的演变过程:
- 相信用户的创造力: OpenAI 意识到,AI 实验室员工不应成为决定用户应该或不应该创造什么的仲裁者。用户在使用过程中的创造力往往超出 OpenAI 的预期,甚至发现了一些 OpenAI 团队由于视角有限而未曾想到的使用案例。
- 平衡风险与价值: 过去,OpenAI 倾向于关注潜在危害,采取广泛的限制措施。但 Jang 认为,这种框架存在缺陷,它暗示着细微的、日常的好处必须在假设的最坏情况下证明自己,而这低估了快乐、幽默和联系的小时刻如何真正改善人们的生活。
- 重视未知可能性: OpenAI 认识到,过度限制可能会扼杀创新和积极互动。因此,他们开始重视新功能解锁的二阶或间接影响,即那些因为害怕最坏情况而从未实现的积极互动、创新和想法。
公众人物与“冒犯性”内容:更灵活的处理方式
针对公众人物的图像生成,OpenAI 决定不去做“谁足够重要”的裁判,而是创建一个选择退出列表,让任何可能被模型描绘的人自己决定是否允许生成。
在处理“冒犯性”内容时,OpenAI 也在反思,任何不适是源于个人意见或偏好,还是源于对现实世界造成伤害的可能性。例如,过去模型可能会拒绝“让这个人的眼睛看起来更亚洲化”或“让这个人更胖”的请求,无意中暗示这些特征本身就是冒犯性的。
GPT-4o 的新机遇与挑战
Joanne Jang 引用了同事 Jason Kwon 的一句话:“船在港口最安全;最安全的模型是拒绝一切的模型。但这不是船或模型的用途。”
正是基于以上考虑,加上 OpenAI 在精确评估技术方面的进步,促使他们采取了更宽松的政策。这也解释了为什么用户现在可以使用 GPT-4o 模仿皮克斯、吉卜力等创意工作室的风格。
然而,OpenAI 目前仍限制模型模仿在世艺术家的个人风格,以避免引发关于 AI 训练数据集中版权作品合理使用的争论。
GPT-4o 所带来的效果提升正在给广告、影视、游戏等行业带来新变化。但与此同时,内容限制的放宽也带来了新的挑战,例如如何平衡创造自由与防止潜在伤害,如何处理公众人物的形象权,以及如何避免模型生成带有偏见或歧视性的内容。
OpenAI 的新策略无疑是一次大胆的尝试,它将在实践中不断调整和完善。正如 Jang 所说,OpenAI 的目标是最大限度地发挥创造自由,同时防止真正的伤害。
参考文献:
- Jang, J. (2025, March 28). OpenAI peels back ChatGPT’s safeguards around image creation. TechCrunch. Retrieved from https://techcrunch.com/2025/03/28/openai-peels-back-chatgpts-safeguards-around-image-creation/
- Jang, J. (2025, March 29). [Twitter post]. Retrieved from https://x.com/joannejang/status/1905341734563053979
- 机器之心. (2025, March 29). 被吉卜力刷屏的背后:OpenAI模型行为负责人揭秘GPT-4o新生成策略. Retrieved from (Original URL of the article)
(注:由于无法访问互联网,我无法提供机器之心文章的原始URL。请您自行补充。)
Views: 0