目前接手的申请表主要有2种,我的识别算法流程比较简单:
0>. 表格矫正, 基于4个交点做单应性矩阵变换
1>. 表格分类,根据标题头 分类
2>. 感兴趣区域标注,粗定位
3>.目标精定位
4>. 判断有无勾选
5>.格式化信息输出
(二)识别的效果如下 (51张样本,除了1张 表格矫正错误)
对于很模糊的样本,依然可以定位:
算法的难点在于 线条定位,以及 感兴趣区域标注,和目标定位算法上。
(二)线条定位算法,考虑到 图像输入的质量问题,我目前使用的是 线条分割算法(LSD) + 线条聚类 算法。
定位效果(完整性,不错):
(三)目标定位
使用 模板特征算法 精定位( 首先去除了光照的影响,然后 使用 差异最大值 做输出特征)
整个算法 都是基于灰度图像而设计,对 模糊,光照 都有一定的鲁棒性。
至此初级版本识别引擎可以出炉了,测试的效率如下:
整个算法大约 300ms以内。