【数据应用案例】通过字体识别国籍

案例来源:@量子位

案例地址:https://mp.weixin.qq.com/s/m8IQNuCZUCHUUzw1OZEJpg

1. 目标:基于字体,识别国籍(中国、印度、马来西亚、孟加拉国、伊朗五个国家)

2. 数据预处理

    1)处理文本图像中的噪点

    2)抽取行文本图像

2. 特征工程

    1)字母间距离

    2)Cloud of Line Distribution软件抽取的笔画特征

        a. 线分布特征:垂直度和弯曲度

        b. 描边特征

        c. 笔记关键点特征

    3)将各特征表征在极坐标,使用PCA进行降维

3. 分类器:SVM

4. 效果:75%的准确率,还有很大提升空间

猜你喜欢

转载自blog.csdn.net/u013382288/article/details/81503030