百度的UniVG模型,即“统一模态视频生成系统”,是一个创新的视频生成技术。它针对视频生成的挑战,提出了高自由度和低自由度两种生成任务的区分策略。在高自由度任务中,UniVG采用多条件交叉注意力技术,确保生成的视频与输入的图像或文本语义高度一致。