深度学习-YOLOV3在百度点石数据集测试

github:https://github.com/wucj123/YOLOV3#yolov3

训练集

来自百度点石广告大赛的训练集,共9000张,60类,随机取1/5,共1780张用作测试集,剩余7220张用作训练集,取10%用作验证集。

训练过程

阶段一:150个epoch,batch=10,learning rate为1e-3,每3个epoch,loss不下降,则降低为原来0.5,20个epoch不下降则停止训练。val loss=28,70个epoch停止,最后调整lr=6.103515914901436e-08,时间420s/epoch。

阶段二:load阶段一中保存的weight,200个epooch,其他设置同阶段一,第82个earlystoppping,lr=3.906250185536919e-06,val-loss=11。

训练结果

各类AP(iou=0.5)以及mAP如下所示

原因分析

mAP较小原因:

主要原因是数据集太少,可与voc比较,voc07共20类,训练集5000张图片左右,平均每类约为250张,而本数据集,训练集7220*0.9,约为6500张,共60类,平均每类105张,所以数据集至少要扩充一倍,这是下一步要做的工作。

个别类别AP极高,个别极低原因:

比如uniqlo,优衣库,之所以效果好,与此品牌设计有关,是一个整体,红底白色的正方形,所以训练比较容易,而xbk以及st_sat之所以比较难,跟数据有关,这两类或者比较低的几类,商标采用灯光式设计,照片拍出来识别度不高,所以需要对数据进行下一步处理。

经数据扩充之后训练结果如下:

分析

两次结果比较看出,每一类的AP值都得到大幅提升,mAP也提升到了60%,所进行的数据扩充起到了明显作用,虽然没有达到比赛中80%的效果,猜测原因有二:一为我的测试集只有1780张,而在比赛中用的测试集为4600张,确实不一个级别;二维我所使用的测试集本来是用做训练的,对于图片中一些品牌的标注,不够严谨。

猜你喜欢

转载自blog.csdn.net/qq_41994006/article/details/81111418