关于申请表的简单识别方法

目前接手的申请表主要有2种,我的识别算法流程比较简单:

0>. 表格矫正,  基于4个交点做单应性矩阵变换

1>. 表格分类,根据标题头 分类

2>. 感兴趣区域标注,粗定位

3>.目标精定位

4>. 判断有无勾选

5>.格式化信息输出

(二)识别的效果如下 (51张样本,除了1张 表格矫正错误)

对于很模糊的样本,依然可以定位:

算法的难点在于 线条定位,以及 感兴趣区域标注,和目标定位算法上。

(二)线条定位算法,考虑到 图像输入的质量问题,我目前使用的是 线条分割算法(LSD)  + 线条聚类 算法。

定位效果(完整性,不错):

(三)目标定位

使用 模板特征算法 精定位( 首先去除了光照的影响,然后 使用 差异最大值 做输出特征)

    整个算法 都是基于灰度图像而设计,对 模糊,光照 都有一定的鲁棒性。

至此初级版本识别引擎可以出炉了,测试的效率如下:

整个算法大约 300ms以内。

猜你喜欢

转载自blog.csdn.net/laoki/article/details/82528382