好的,根据你提供的信息,我将撰写一篇关于腾讯混元图生视频模型的新闻报道。
腾讯混元“闪电战”:图生视频模型上线,挑战AI视频生成格局
摘要: 腾讯混元近日推出图生视频模型,用户仅需上传图片并输入提示词,即可生成高清短视频。此举正值腾讯元宝App强势崛起之际,引发业界关注。本文将深入探讨混元图生视频模型的技术特点,并通过实际案例分析其在表情控制、剧情生成和广告制作等方面的表现,同时关注其在主体一致性方面存在的挑战。
正文:
在人工智能领域,腾讯正以一场“闪电战”式的速度,试图重塑市场格局。3月6日,腾讯混元悄然上线并开源了图生视频模型,为AI视频生成领域再添一把火。这一举动,恰逢腾讯元宝App在中国区苹果AppStore免费榜单上登顶,后者在接入DeepSeek后,排名一路飙升,短短数周内便从200名开外跃居榜首,成为现象级产品。
此次推出的混元图生视频模型,允许用户通过上传图片并输入不超过200字的提示词,生成一段5秒钟、最高可达2K高清的视频,并自带配音。为了更直观地了解其性能,我们进行了一系列实测。
表情控制:细腻的情感捕捉
表情是视频内容中至关重要的元素。我们首先测试了混元在表情控制方面的能力。上传奥斯卡影帝阿德里安·布劳迪的剧照,并输入提示词“男人悲伤地流泪”,生成的视频中,人物的表情细腻,眉宇间的忧伤和眼角的泪光都得到了较好的呈现。
随后,我们使用Midjourney生成的人物特写照片,提示词为“男人微笑起来”。结果显示,混元能够捕捉到微笑时眼部和嘴部的细微变化,生成的视频自然生动。
剧情向视频:想象力的延伸
在剧情向视频的生成方面,我们尝试输入较为复杂的提示词,例如“老人坐在长椅上,这时从画面右侧走过来一个年轻女性,看着老人”。混元能够较好地理解并执行这一指令,视频中不仅出现了老人和年轻女性,还在远处生成了缓缓驶过的汽车,增强了场景的真实感。
然而,在测试中我们也发现,混元在保持人物主体一致性方面仍有提升空间。例如,在使用凯拉·奈特利的剧照生成视频时,虽然动作流畅自然,但人物的面貌发生了改变。
广告片制作:创意的新可能
AI视频生成技术在广告制作领域具有广阔的应用前景。我们上传了一张树莓冰激凌的图片,并借助接入DeepSeek的腾讯元宝生成提示词,最终得到了一个超现实主义的美食CG动画,威化甜筒冰淇淋的细节和覆盆子溅起水花的动态都得到了很好的展现。
此外,我们还测试了香水广告的生成,效果同样令人满意。
更多功能:对口型与动作驱动
除了图生视频功能外,混元视频还上线了对口型和动作驱动功能。用户只需上传一张不带手的头肩半身照,并提供一段音频或文本,即可生成角色说话的视频。此外,用户还可以选择动作模板,让上传的图片人物“跳广场舞”。
结论与展望:
腾讯混元此次推出的图生视频模型,无疑为AI视频生成领域注入了新的活力。凭借其在表情控制、剧情生成和广告制作等方面的潜力,混元有望在短视频创作、内容营销等领域发挥重要作用。然而,在主体一致性等方面,混元仍有提升空间。
随着技术的不断发展,我们有理由相信,AI视频生成将在未来迎来更广阔的应用前景。
参考文献:
- AI好好用. (2024, March 6). 腾讯混元上线图生视频模型,我们用7个Prompt测试了下. 机器之心. Retrieved from [此前提供的体验链接,如果需要]
- 机器之心. (2024, March 6). 腾讯版Sora来了!我们抢先实测:最懂镜头的AI,有《花样年华》那味了. 机器之心. Retrieved from [机器之心网站]
[注:由于你提供的信息中没有明确的发布日期,我假设为2024年3月6日。请根据实际情况修改。]
Views: 0