一、原始结构上的参数调整
1. ROI与黑白框
ROI |
|
|
mAP(%) |
不加ROI |
|
|
50.06 |
[0 352] |
[100 260] |
白框 |
45.93 |
|
|
黑框 |
51.72 |
[0 352] |
[100 270] |
黑框 |
52.40 |
[0 352] |
[100 280] |
白框 |
43.29 |
|
|
黑框 |
53.49 |
彻底舍弃白框ROI
ROI |
|
|
mAP(%) |
不加ROI |
|
|
50.06 |
[0 352] |
[100 260] |
黑框 |
51.72 |
[0 352] |
[100 270] |
黑框 |
52.40 |
[0 352] |
[100 280] |
黑框 |
53.49 |
[0 352] |
[100 290] |
黑框 |
54.08 |
[0 352] |
[100 300] |
黑框 |
54.40 |
|
[100 305] |
|
53.93 |
[0 352] |
[100 310] |
黑框 |
54.43 |
|
[100 315] |
|
54.38 |
[0 352] |
[100 320] |
|
53.01 |
[0 352] |
[100 330] |
|
51.87 |
|
[10 310] |
|
|
|
[20 310] |
|
56.07 |
|
[30 310] |
|
56.19 |
|
[40 310] |
|
57.70 |
|
[45 310] |
|
57.36 |
|
[50 310] |
|
57.19 |
|
[60 310] |
|
56.64 |
|
[70 310] |
|
|
|
[80 310] |
|
55.54 |
|
[90 310] |
|
54.99 |
|
[100 310] |
|
54.43 |
|
[110 310] |
|
53.58 |
|
[150 310] |
|
42.62 |
确定了右边的框为[40 310]
[] |
[40 310] |
|
|
57.70 |
[10 352] |
|
|
|
56.69 |
[10 320] |
|
|
|
56.69 |
[30 352] |
|
|
|
54.34 |
[50 352] |
|
|
|
48.57 |
[0 280] |
|
|
|
56.59 |
[0 300] |
[40 310] |
|
|
57.70 |
[0 320] |
|
|
|
57.70 |
[0 340] |
|
|
|
57.70 |
ROI参数固定为[40 300]
2. minsize face to detect
Minisize of face to detect |
mAP(%) |
20 |
57.70 |
30 |
59.98 |
33 |
59.79 |
34 |
59.74 |
35 |
60.37 |
36 |
59.42 |
37 |
60.00 |
40 |
57.28 |
50 |
51.66 |
ROI定为
[0 300] |
[40 310] |
MiniSize of face定为 35
scale stride
测试stride
初始0.7 |
60.37 |
0.9 |
60.91 |
0.8 |
60.56 |
0.5 |
59.24 |
二、新网络结构的参数调整
(pnet与rnet更改,onet为原版onet代码)
ROI=[0,300,40,310]
2.1 minsize的调整
scale stride=0.9
minsize | mAP(%) |
35 | 61.84 |
32 | ~=62 |
30 | 63.08 |
27 | ~=62 |
25 | 62.43 |
2.2 scale stride
scale stride | mAP(%) |
0.95 | 60.97 |
0.9 | 63.08 |
0.85 | 61.94 |
0.7 | 59.78 |
三、新结构
只有3×3的卷积,后两层padding都为same.
有7层卷积
3.1 关于nms的阈值。
可以增大相应的阈值来增大查准率precision,减小recall
关于非极大值抑制的阈值
非极大值抑制的方法是:假设有6个矩形框,根据分类器的类别分类概率做排序,假设从小到大的概率 分别为A、B、C、D、E、F。
(1)从最大概率矩形框F开始,分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;
(2)假设B、D与F的重叠度超过阈值,那么就扔掉B、D;并标记第一个矩形框F,是我们保留下来的。
(3)从剩下的矩形框A、C、E中,选择概率最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是我们保留下来的第二个矩形框。
就这样一直重复,找到所有被保留下来的矩形框。
阈值越大,则融合更不容易,产生的备选框越多
阈值设置 | mAP(%) |
inter scale nms: 0.5 pnet nms阈值:0.7 rnet nms阈值:0.7 onet nms阈值:0.7 |
62.97 |
inter scale nms: 0.5 pnet nms阈值:0.7 rnet nms阈值:0.9 onet nms阈值:0.7 |
64.65 |
inter scale nms: 0.5 pnet nms阈值:0.7 rnet nms阈值:0.9 onet nms阈值:0.9 |
58.05 |
inter scale nms: 0.7 pnet nms阈值:0.9 rnet nms阈值:0.9 onet nms阈值:0.7 |
65.08 |
inter scale nms: 0.4 pnet nms阈值:0.6 rnet nms阈值:0.8 onet nms阈值:0.7 |
62.92 |
inter scale nms: 0.5 pnet nms阈值:0.5 rnet nms阈值:0.7 onet nms阈值:0.6 |
60.73 |
对阈值调参,考虑到运行速度,nms的阈值暂时选用
增大阈值会增大precision,减小recall
inter scale nms: 0.5
pnet nms阈值:0.7
rnet nms阈值:0.7
onet nms阈值:0.7
Three thresholds for pnet, rnet, onet | mAP(%) |
[0.8, 0.8, 0.8] | 62.97 |
[0.9, 0.8, 0.9] | 63.09 |
[0.8, 0.8, 0.9] | 62.29 |
[0.9, 0.9, 0.95] | 60.57 |
[0.9, 0.8, 0.95] | 62.66 |
[0.8, 0.8, 0.95] | 62.29 |