OCR的原理是先对文字进行分割,去除变形,去噪声,然后对单个字符进行分类或者比对,看结果是否相同。
对单个字符的分类比对,步骤如下:
- 灰度化:目的是去除掉彩色图像信息,只保留一个维度的像素点信息。
- 二值化:设置一个阈值,将灰度的图片处理成黑白的图片,大于某个值的时候即为白色,小于某个值的时候即为黑色。
- 噪声去除:去除外部的噪声点。
- 倾斜矫正:把拍出来的照片的倾斜矫正。
5. 字符切割:把成段或者成行的字符切割成单个字符。
6. 字符识别:把切割好的单个字符识别出来。
7. 版面还原。
8. 后处理,校对。
文字识别的分类:
- 直接使用他人平台与引擎。
- 特征提取,输入分类器。(大量的特征工程)
- 深度学习,CNN。(不需要特征提取,但是需要大量的样本数据。)
- 字符模板匹配法。(适用于简单的场景,字体统一,清晰度高,不需要建模,简单有效)
模板匹配的方法: