OCR(Optical Character Recognition):光学字符识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。 OCR 的应用场景: 扫描件的文字识别:纸质扫描件,PDF文件,纸书籍转电子书 卡证文字识别:名片,身份证,银行卡 车牌设别:多用在停车场和交警执法 票据识别:报销凭证,税务票据,医疗票据 教育领域:公式识别,自动判卷,自动答题 原理:扫描/拍照 > 图像输入 > 二值化 > 去噪声 > 倾斜校正 > 版面分析 > 字符切割 > 字符识别 > 版面恢复 > 文字校对