人工智能课程讲解。今天我们讨论的话题是数据增强,英文为Data Augmentation。数据增强是通过对现有训练数据进行合理操作来创建新的、增强的数据样本的过程。这些新样本通常被添加到训练集中。我们在模型训练之前的数据预处理步骤中执行数据增强。例如对于图像数据,我们可以通过许多图像修改技术来实现数据增强,比如: 裁剪图像,旋转,平移,翻转图像,放大或缩小图像,改变图像颜色,改变亮度等等。使用数据增强的一个原因是简单地增加训练集的大小,使其变得更大,样本更多样性。如图所示,左边我们有一个较小的数据集,是哑铃的图像,样本不具备多样性,彼此之间看起来很相似。但当观察右边图像时,我们对训练集使用了数据增强,可以发现此时的哑铃图像样本的数据集变得更大且具备多样性。我们对图像样本进行了合理地修改操作来增加这种多样性。我们可以发现其中一些图像放大或缩小,适度旋转,甚至改变图像颜色。