【推理引擎】模型压缩03:感知量化训练QAT原理!伪量化节点计算方式!量化特性! 感知量化训练(Aware Quantization Training)模型中插入伪量化节点fake quant来模拟量化引入的误差。端测推理的时候折叠fake quant节点中的属性到tensor中,在端测推理的过程中直接使用tensor中带有的量化属性参数。