这项工作提出了一种新的类别级操纵框架,利用以对象为中心的类别级表示和无模型的6自由度运动跟踪。标准对象表示仅在模拟中学习,然后用于从单个演示视频解析类别级别的任务轨迹。通过正则表示法,将演示重新投影到针对新对象定制的目标轨迹。通过局部注意机制沿操纵视界自动选择帧。该框架允许通过仅提供一个演示来教授不同的操作策略,而无需复杂的手动编程。大量实验表明,该方法在高精度装配领域的一系列具有挑战性的工业任务中是有效的,这些任务涉及学习复杂的、长期的策略。该过程对由于动力学以及对象实例和场景配置的泛化而产生的不确定性具有鲁棒性。