该模型能根据静态图像生成视频,以及在现有视频中填充缺失的帧或扩展视频。能够生成具有多个角色、特定类型的运动以及精确的主题和背景细节的复杂场景。除了能够仅由文本指令生成视频外,该模型还能够获取现有的静态图像并从中生成视频,并精确地将图像内容动画化。