EchoMimicV2通过输入一段音频、一张参考图片以及简单的手势序列,它可以生成包头部、手势和上半身动作 的动态视频。适用于虚拟主播、视频制作、动画生成等场景,能够让角色的动作与语音高度匹配,表现生动自然