MotionCanvas：港中文联手Adobe，图像秒变视频！

香港中文大学、Adobe研究院和莫纳什大学联合推出了一种名为MotionCanvas的创新图像到视频（I2V）生成方法，为静态图像注入了鲜活的生命力，让用户能够以直观的方式控制视频的动态效果。

长期以来，将静态图像转化为动态视频一直是计算机视觉领域的一大挑战。传统的视频制作流程繁琐复杂，需要专业技能和大量时间投入。而MotionCanvas的出现，有望彻底改变这一现状，为视频创作带来革命性的变革。

MotionCanvas的核心优势在于其引入的运动设计模块。 用户不再需要复杂的编程或动画技巧，只需在图像上直观地规划相机运动和物体运动，即可实现复杂的镜头设计。例如，用户可以轻松地设计相机的平移、旋转、变焦等效果，以及物体的全局运动（如移动、缩放）和局部运动（如手臂摆动）。

该方法的技术原理主要包括三个关键模块：

运动设计模块： 用户在输入的图像上进行相机和物体运动的设计，相机运动基于关键帧的相机姿态，物体运动则通过场景锚定的边界框和稀疏点轨迹定义。
运动信号转换模块： 将3D场景空间中的运动意图转换为2D屏幕空间中的运动信号，基于深度估计和相机参数估计，将3D相机路径转换为2D点轨迹，并将场景锚定的边界框和点轨迹转换为屏幕空间中的信号。
运动条件视频生成模型： 基于预训练的DiT（Diffusion Transformer）模型进行微调，使其能够根据屏幕空间中的运动条件生成视频。模型基于编码点轨迹和边界框序列，作为条件信号输入到视频生成模型中。

MotionCanvas的应用场景十分广泛：

该项目已开源，相关资源如下：

MotionCanvas的出现，无疑为视频创作领域注入了新的活力。它降低了视频制作的门槛，让更多人能够轻松地将静态图像转化为引人入胜的动态视频。随着技术的不断发展，我们有理由相信，MotionCanvas将在未来的视频创作领域发挥越来越重要的作用。

未来展望：

MotionCanvas的成功，预示着图像到视频生成技术将迎来更加广阔的发展前景。未来的研究方向可能包括：

MotionCanvas的出现，不仅是一项技术突破，更是一种创作理念的革新。它将视频创作的权力交还给用户，让每个人都能成为视频创作者。

参考文献：