【推理系统】模型压缩01:模型压缩架构和流程总体介绍!量化、剪枝、蒸馏、二值化! 如今学术界新提出的神经网络模型越来越大,而在实际应用中很多模型都要被部属在移动端。移动端的存储空间以及算力都有限,无法运行太大的模型,所以模型压缩这个概念就应运而生,一起来开启模型压缩架构和流程总体介绍。