复旦阿里联手打造零样本视频生成框架！

作者智能小编

11 月 2, 2024 #样本, #每日AI快讯

shanghai

复旦大学和阿里巴巴集团等机构联合推出的 DreamVideo-2，为视频定制领域带来了革命性的突破。 这一创新框架能够根据单一图像和界定框序列，生成具有特定主题和精确运动轨迹的视频，无需在测试时进行微调。这意味着用户只需提供一张图片和简单的运动指令，就能轻松制作出个性化的视频内容。

DreamVideo-2的核心优势在于其零样本定制能力。 传统的视频生成模型通常需要大量训练数据，才能实现特定主题的视频生成。而 DreamVideo-2 则利用参考注意力机制，从单一图像中学习主题外观，并通过二值掩码控制运动轨迹，实现精确的运动控制。

该框架的创新之处在于其混合掩码参考注意力和重加权扩散损失。 混合掩码参考注意力能够增强目标位置的主题表征，提升主题的准确性。而重加权扩散损失则平衡了主题学习和运动控制，确保生成的视频既符合主题要求，又具有流畅的运动效果。

DreamVideo-2 的应用场景十分广泛。 在娱乐与社交媒体领域，用户可以根据个人喜好快速生成包含特定人物或物体的视频内容，用在社交媒体分享或个人娱乐。在电影与视频制作领域，电影制作人可以用 DreamVideo-2 预览特效或场景，或生成特定的动作序列，减少实际拍摄的成本和时间。在广告与营销领域，企业可以创建更具吸引力的广告，用特定产品或品牌为主题，提高广告的个性化和互动性。

DreamVideo-2 的出现，标志着视频定制技术迈入了新的发展阶段。 这一技术突破将为视频制作、广告营销、教育培训等领域带来巨大的变革，并为用户创造更丰富、更个性化的视频体验。

参考文献：