腾讯联手清华，打造超清视频新技术！

腾讯与清华联手打造高分辨率视频扩展技术：Follow-Your-Canvas

引言：

在数字内容时代，高分辨率视频的需求日益增长。然而，现有的视频扩展技术往往受限于 GPU 内存和计算能力，难以处理大规模视频外延任务。为了解决这一难题，腾讯混元团队与清华大学等机构合作推出了 Follow-Your-Canvas，一种能够将视频内容扩展到任意分辨率，同时保持高质量内容生成和无缝衔接的创新技术。

Follow-Your-Canvas 的核心优势：

高分辨率输出： 将视频内容扩展到任意分辨率，例如从 4K扩展到 8K 或更高，满足各种应用场景的需求。
不受显存大小限制： 能够处理大规模视频外延任务，突破了 GPU 内存的限制，为高分辨率视频处理提供了新的可能。
时空一致性： 在扩展过程中，保持视频的空间和时间一致性，确保最终输出的视频质量与原视频风格一致，避免出现画面扭曲或不自然现象。
生成丰富新内容： 在指定的扩展区域生成与原视频风格一致的新内容，提升整体视觉效果，使扩展后的视频更加自然流畅。
大规模视频外延： 在大规模视频外延方面表现出色，例如将 512×512 分辨率的视频扩展到 1152×2048（约 9 倍）分辨率，展现出强大的处理能力。

Follow-Your-Canvas 的技术原理：

Follow-Your-Canvas 采用了一种基于分布式处理和布局对齐的创新技术，将视频内容扩展到任意分辨率。其核心原理包括：

空间窗口分割： 将视频分割成多个空间窗口，每个窗口独立进行内容生成，然后无缝合并，能够处理任意大小和分辨率的视频，不受 GPU 内存限制。
布局编码器： 通过布局编码器提取源视频的全局布局信息，注入到每个窗口的生成过程中，确保新生成的内容与原视频布局协调一致，避免出现画面错位或比例失衡。
相对区域嵌入： 提供源视频与目标窗口之间的相对位置关系，进一步指导每个窗口的生成过程，生成与原视频布局相协调的扩展内容，提高空间和时间一致性。
分布式生成： 在多个 GPU 上并行处理各个窗口的内容生成，最后将生成的窗口无缝合并成最终的视频，提高了处理效率。

Follow-Your-Canvas 的应用场景：

Follow-Your-Canvas 在多个领域具有广泛的应用前景：

视频尺寸调整：将手机拍摄的竖屏视频扩展为横屏，适应不同的播放需求，例如在社交媒体上的展示或在宽屏电视上的观看。
超宽屏视频生成： 将普通视频扩展为超宽屏视频，提供更广阔的视野，适用于电影院或超宽屏显示器的播放。
全景视频制作： 基于视频扩展技术，将普通视频转换为全景视频，增强观看体验，适用于虚拟现实 (VR) 和 360 度视频制作。
高分辨率视频输出： 能够处理高达 16K 分辨率的视频输出，适用于需要高清晰度视频的场合，如电影制作或高质量广告片。

总结：

Follow-Your-Canvas 是腾讯与清华大学合作推出的高分辨率视频扩展技术的成果，其强大的功能和创新技术为高分辨率视频处理提供了新的解决方案。该技术不仅能够克服 GPU 内存限制，还能保持视频的时空一致性和高质量内容生成，在视频尺寸调整、超宽屏视频生成、全景视频制作和高分辨率视频输出等方面具有广泛的应用前景。随着人工智能技术的不断发展，Follow-Your-Canvas 有望在未来推动视频内容创作和传播的革新。

参考文献：