北京 – 自OpenAI推出具备“吉卜力”滤镜的GPT-4o以来,AI绘画领域再次掀起波澜。社交媒体上涌现大量宫崎骏风格作品,ChatGPT也因此吸引了大量用户。面对这一市场热潮,各家科技公司纷纷加速布局,力图在AI绘画领域占据一席之地。
近日,字节跳动悄然启动了“即梦3.0”模型的灰度测试,该模型主打“影视质感、文字更准、直出2K高清图”的特性。此前,Ideogram已率先发布并免费开放其3.0模型,而Midjourney CEO也暗示即将推出V7版本,竞争态势愈发激烈。
AI“补齐短板”,文字生成能力显著提升
长期以来,AI在图像生成领域存在“文字识别”的短板。生成的图像中,文字往往出现乱码或错误。然而,随着各家公司加大研发投入,AI的文字生成能力得到了显著提升。以GPT-4o为例,现在甚至可以生成漫画作品,AI已不再是“文盲”。
“即梦3.0”的一大亮点便是其强大的文字生成能力,尤其是在中文文字的处理上。
实测对比:各有千秋,字节“即梦”表现亮眼
为了更直观地了解“即梦3.0”的性能,我们将其与GPT-4o、Ideogram 3.0进行了对比测试。
- 提示词1: 一个黄色的易拉罐漂浮在空中,罐身上凝结着水滴,并写着英文 “Soda”,周围环绕着新鲜的柠檬半块和切片,冰块在空中散落,营造出一种清爽的氛围。背景是蓝天和柔软的云朵,整个场景呈现出零重力的效果,采用写实风格的摄影表现,光线明亮而鲜艳。
在这一轮测试中,三款AI工具均能准确识别英文单词“Soda”,但在配色和光影处理上有所差异。“即梦3.0”呈现出日系小清新的朦胧美感,配色较浅,光影处理也更为出色。GPT-4o生成的画面清晰度较高,但字体略显呆板。Ideogram 3.0则用色较重,整体画面偏暗。
- 提示词2: 一张照片展示了一个淡绿色和白色的化妆品乳霜罐,罐身上印有深红色字体的品牌标识 “Freitas_Arts”。罐子放置在一个自然背景中,周围有光滑的石头、浅浅的清澈水池,水面反射着柔和的涟漪,还有洋甘菊的枝条,其花瓣洁白细腻,花心呈黄色,周围点缀着新鲜的绿叶和艺术地散落的草叶。这张照片是在专业摄影棚拍摄的,光线设计突出了乳霜罐的质感和细节,同时将其自然地融入到宁静的自然主题场景中。
Ideogram 3.0在审美方面表现更胜一筹,画面整体协调,元素比例大小也恰到好处。“即梦3.0”在细节处理上没有明显问题,但化妆品瓶身的配色略显逊色。
- 提示词3: 画一个肯德基的简体中文菜单,其中有一个套餐叫做 “V 我 50”。
在中文文字识别方面,“即梦3.0”表现出色,是唯一一个能够正确生成中英文的模型。然而,生成的图像更像是一个优惠海报,而非菜单。GPT-4o和Ideogram 3.0在生成英文方面没有问题,但在处理中文时则出现了乱码。
“即梦3.0”的应用前景
通过测试可以看出,“即梦3.0”在插画风格和写实风格的图像生成方面均表现出色,能够较好地处理中文和英文文字。除了设计电影海报、时尚杂志外,该模型还可以用于制作可爱的九宫格表情包。
AI绘画的未来:机遇与挑战并存
AI绘画技术的快速发展,无疑为内容创作领域带来了新的机遇。然而,对于设计师而言,这也意味着新的挑战。AI绘画工具的普及,可能会降低部分设计工作的门槛,使得设计师面临更大的竞争压力。
但与此同时,AI也可以成为设计师的得力助手,帮助他们提高工作效率,拓展创作思路。关键在于,设计师需要不断学习和适应新技术,将AI工具融入到自己的工作流程中,才能在未来的竞争中立于不败之地。
参考文献
- 机器之心. (2024). 实测完即梦3.0,我后悔大学选了设计专业…… Retrieved from [在此处插入文章链接]
Views: 0