复杂场景中视频帧间对象的稳定关联对多目标跟踪等应用至关重要。现有方法多依赖特定领域的标记视频数据集,限制了跨域泛化能力。MASA,一种无需跟踪标签即可跨域匹配视频中任意对象的新方法。MASA利用Segment Anything Model(SAM)的丰富对象分割,通过全面数据变换学习实例级对应。MASA适配器可与基础分割或检测模型配合,实现复杂领域内的零次学习跟踪。