Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site. ... 

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.

0

北京 – 自OpenAI推出具备“吉卜力”滤镜的GPT-4o以来,AI绘画领域再次掀起波澜。社交媒体上涌现大量宫崎骏风格作品,ChatGPT也因此吸引了大量用户。面对这一市场热潮,各家科技公司纷纷加速布局,力图在AI绘画领域占据一席之地。

近日,字节跳动悄然启动了“即梦3.0”模型的灰度测试,该模型主打“影视质感、文字更准、直出2K高清图”的特性。此前,Ideogram已率先发布并免费开放其3.0模型,而Midjourney CEO也暗示即将推出V7版本,竞争态势愈发激烈。

AI“补齐短板”,文字生成能力显著提升

长期以来,AI在图像生成领域存在“文字识别”的短板。生成的图像中,文字往往出现乱码或错误。然而,随着各家公司加大研发投入,AI的文字生成能力得到了显著提升。以GPT-4o为例,现在甚至可以生成漫画作品,AI已不再是“文盲”。

“即梦3.0”的一大亮点便是其强大的文字生成能力,尤其是在中文文字的处理上。

实测对比:各有千秋,字节“即梦”表现亮眼

为了更直观地了解“即梦3.0”的性能,我们将其与GPT-4o、Ideogram 3.0进行了对比测试。

  • 提示词1: 一个黄色的易拉罐漂浮在空中,罐身上凝结着水滴,并写着英文 “Soda”,周围环绕着新鲜的柠檬半块和切片,冰块在空中散落,营造出一种清爽的氛围。背景是蓝天和柔软的云朵,整个场景呈现出零重力的效果,采用写实风格的摄影表现,光线明亮而鲜艳。

在这一轮测试中,三款AI工具均能准确识别英文单词“Soda”,但在配色和光影处理上有所差异。“即梦3.0”呈现出日系小清新的朦胧美感,配色较浅,光影处理也更为出色。GPT-4o生成的画面清晰度较高,但字体略显呆板。Ideogram 3.0则用色较重,整体画面偏暗。

  • 提示词2: 一张照片展示了一个淡绿色和白色的化妆品乳霜罐,罐身上印有深红色字体的品牌标识 “Freitas_Arts”。罐子放置在一个自然背景中,周围有光滑的石头、浅浅的清澈水池,水面反射着柔和的涟漪,还有洋甘菊的枝条,其花瓣洁白细腻,花心呈黄色,周围点缀着新鲜的绿叶和艺术地散落的草叶。这张照片是在专业摄影棚拍摄的,光线设计突出了乳霜罐的质感和细节,同时将其自然地融入到宁静的自然主题场景中。

Ideogram 3.0在审美方面表现更胜一筹,画面整体协调,元素比例大小也恰到好处。“即梦3.0”在细节处理上没有明显问题,但化妆品瓶身的配色略显逊色。

  • 提示词3: 画一个肯德基的简体中文菜单,其中有一个套餐叫做 “V 我 50”。

在中文文字识别方面,“即梦3.0”表现出色,是唯一一个能够正确生成中英文的模型。然而,生成的图像更像是一个优惠海报,而非菜单。GPT-4o和Ideogram 3.0在生成英文方面没有问题,但在处理中文时则出现了乱码。

“即梦3.0”的应用前景

通过测试可以看出,“即梦3.0”在插画风格和写实风格的图像生成方面均表现出色,能够较好地处理中文和英文文字。除了设计电影海报、时尚杂志外,该模型还可以用于制作可爱的九宫格表情包。

AI绘画的未来:机遇与挑战并存

AI绘画技术的快速发展,无疑为内容创作领域带来了新的机遇。然而,对于设计师而言,这也意味着新的挑战。AI绘画工具的普及,可能会降低部分设计工作的门槛,使得设计师面临更大的竞争压力。

但与此同时,AI也可以成为设计师的得力助手,帮助他们提高工作效率,拓展创作思路。关键在于,设计师需要不断学习和适应新技术,将AI工具融入到自己的工作流程中,才能在未来的竞争中立于不败之地。

参考文献

  • 机器之心. (2024). 实测完即梦3.0,我后悔大学选了设计专业…… Retrieved from [在此处插入文章链接]


>>> Read more <<<

Views: 0

0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注