python+opencv实现车牌识别

文章目录：

    一、前言
    二、训练分类器
        2.1、准备训练用单字符图片
        2.2、图片预处理
        2.3、用opencv的preprocess_hog()处理图片
        2.4、用SVM训练分类器
    三、车牌定位
    四、字符分割
    五、字符识别
    六、Mysql保存
    七、总结
    八、参考资料

一、前言：

最近一直在学习机器学习，花了段时间把《机器学习实战》(【美】Peter Harrington著)看了一遍，当中讲述的几个机器学习经典算法虽说有所掌握（监督学习：k-近邻、决策树、朴素贝叶斯、Logistic回归、SVM、AdaBoost、线性回归、树回归，无监督学习：k-means，FP-Growth），但是还是觉得有点不踏实，于是就找了车牌识别的例子，算是把其中的算法用到了实际的项目中。

环境：
系统：win10
语言：Python3.6
平台：Jupyter Notebook
机器学习库：OpenCV
数据库：Mysql
机器学习算法：SVM

用到的Python库：matplotlib、numpy、opencv、sklearn，这些库通过pip install package安装即可

二、训练分类器

2.1、准备训练用单字符图片
相同字符放在一个文件夹下，文件夹名代表标签
在这里插入图片描述
2.2、图片预处理
读取图片、标签用于后续处理

########################################
##描述：读取图片数据集
##filename_1:图片数据集路径
##return：
##       dataArr：读取到的数据集，拉伸成(4200, 1280)   4200表示有4200张图片  1280 每张图片的宽*高 
##       np.array(label_list)  图片对应的标签
##       np.array(img_org) 原图片
########################################
def load_data_en(filename_1):
    '''
    这个函数用来加载数据集，其中filename_1是一个文件的绝对地址
    '''
    sample_number = 0  # 用来计算总的样本数
    dataArr = np.zeros((4200, 1280))
    label_list = []
    provinces = ['京','闽','粤','苏','沪','浙']

    temp_address = []
    temp = []
    img_org = []
    for i in range(34):
        ## filename_1 = r'E:/Phthon/car_detect/datasets/'
        with open(filename_1+str(i)+'.txt', 'r') as fr_1:
                temp = [row.strip() for row in fr_1.readlines()]
        temp_address.extend(temp)
    length = len(temp_address)
    ##pattern = compile(r'\d+')   # 查找数字，代表特征值
    pattern_en = compile(r'datasets/train_images/training-set/(\d+)*')
    pattern_zh = compile(r'datasets/train_images/training-set/chinese-characters/(\d+)*')
    for j in range(length):
        # print(middle_route[i])
        # print(temp_address_2[j])
        temp_img = cv2.imread(temp_address[j], cv2.COLOR_BGR2GRAY)
        if temp_img is None:
#             print(temp_address[j])
            continue
        sample_number += 1
        img_org.append(temp_img)
        temp_img = temp_img.reshape(1, 40 * 32)
        dataArr[sample_number - 1, :] = temp_img
        
        label = pattern_en.findall(temp_address[j])[0]
        if len(label) == 0:   ## 汉字字符
            pass
            # label = provinces[int(pattern_zh.findall(temp_address[j])[0])]
            
        else:                 ## 非汉字字符
            if int(label) < 10:                      # 数字0-9
                pass
            elif int(label)>=10 and int(label)<=17:  # 字母A-H  没有I
                label = chr(int(label)+55)
            elif int(label)>=18 and int(label)<=22:  # 字母J-N  没有O
                label = chr(int(label)+56)
            else:                                    # 字母P-Z
                label = chr(int(label)+57)
        label_list.append(label)
    return dataArr, np.array(label_list) , np.array(img_org)

2.3、用opencv的preprocess_hog()处理图片
由于光照明暗不同、拍摄角度不同、车牌新旧程度不同，导致拍摄的车牌差异大，并且需要训练时间长，因此需要使用opencv的preprocess_hog()处理图片，取图片的64个主要特征用于训练SVM训练

X2 = preprocess_hog(img_org)

2.4、使用sklearn自带的SVM算法训练分类器

from sklearn.svm import SVC
    svc = SVC(C = 1, gamma = 0.5)

对于训练数据集的训练比较耗时，因此对于训练完成的分类器，最好单独存放，使用时在做load

from sklearn.externals import joblib  # 通过joblib的dump可以将模型保存到本地，clf是训练的分类器
    joblib.dump(svc,dump_str)         # 保存训练好的模型，通过svc = joblib.load("based_SVM_character_train_model.m")调用