上海交大开源“AniTalker”：AI造假新纪元？

上海交大开源对口型说话视频生成框架AniTalker：让静态肖像“开口说话”

上海，2024年5月20日 – 上海交通大学X-LANCE实验室和思必驰AISpeech的研究人员近日联合发布了开源的对口型说话视频生成框架AniTalker。该框架能够将单张静态人像和输入的音频转换成栩栩如生的动画对话视频，为虚拟助手、客服、教育等领域带来新的可能性。

AniTalker的出现，意味着静态图像可以“开口说话”。用户只需提供一张静态人像和一段音频，AniTalker就能生成与音频内容同步的动画视频，人物的面部表情、头部动作、唇动等细节都十分逼真。

AniTalker的核心优势在于：

自监督学习策略： AniTalker通过自监督学习策略捕捉面部的复杂动态，包括微妙的表情和头部动作，无需大量人工标注数据，降低了训练成本。
通用运动表示和身份解耦： AniTalker利用通用运动表示和身份解耦技术，减少了对标记数据的依赖，同时保证了生成视频的真实性和多样性。
扩散模型和方差适配器： AniTalker结合了扩散模型和方差适配器，能够生成多样化和可控制的面部动画，实现类似阿里EMO和腾讯AniPortrait的效果。

AniTalker的主要功能包括：

AniTalker的应用场景十分广泛：

AniTalker的开源发布，将推动对口型说话视频生成技术的进一步发展，为更多应用场景带来新的可能性。

相关链接：

结语：

AniTalker的出现，标志着对口型说话视频生成技术迈上了新的台阶。随着技术的不断发展，相信未来将会有更多更逼真、更智能的动画生成工具出现，为我们的生活带来更多便利和乐趣。

【source】https://ai-bot.cn/anitalker/