上次对验证码进行了分割,接下来是非常辛苦的活了,因为我们要手动的对搜集到的数据进行分类,然后保存到一个表格里作为训练集的数据,之前我根据例程看到他的训练集有四万多行训练集,而我今天手动分类分了半天也才一百多行,我感觉这样我的准确率一定不会太高的,但是姑且把代码和后续的东西先写出来,暂时看看效果,看看准确率能达到多少,毕竟训练集的数据非常少。
接下来的过程:
-
对分割的图片进行分类存储
-
将分类存储的图片整合为csv文件作为训练集
-
读取训练集
-
整理数据
-
构建卷积神经网络模型
-
运行卷积神经网络模型
-
测试准确率
分类存储
这里要补充一点,很多字符从下载的验证码里并没有找到,因为学校生成验证码的时候考虑到了我们可能看错数据,比如1和l,0和o,都没有生成,这无疑减轻了我们分类的压力。
格式归一化并整合到csv
图:格式(图片的长和宽)归一化处理
图:整合到csv并保存
读取训练集
构建卷积神经网络模型。
初始化并运行网络
测试准确率
不到一分钟就跑玩了,数据量太小了,很明显,准确率很低。。。以后有比较多的数据的时候再去做吧。。懒得手动分类了。