1 什么是目标检测
图像处理领域的目标检测(边缘检测)任务:识别出图片中物体的轮廓边缘,定位它们的位置,并用方框框出。
RCNN 2014年
1 利用选择性搜索方法(Selective Search)选出1000到2000个候选框(感兴趣区域,Region Interest)
2 所有候选框缩放至相同大小输入到CNN中
3 每个候选框都进行一次卷积,卷积模型选用(AlexNet预训练模型+fine-turning微调),这样设置计算量巨大不合理。
4 采用SVM分类
SPP-Net,2015年
针对RCNN第3步的问题进行改进,减少卷积次数,不对所有候选框卷积。而是只先进行一次卷积,然后再候选框。
1 同RCNN一样采用选择性搜索方法(Selective Search)选出1000到2000个候选框。
2 只卷积一次得到整张图的feature map,然后找到每个候选框在feature map上的映射patch
3 spp layer层 设计各种尺寸的池化过滤器,统一输出尺寸
Fast-RCNN,2015
同样是只进行一次卷积的思想
1 同样采用选择性搜索方法(Selective Search)选出1000到2000个候选框。
2 只卷积一次得到整张图的feature map,然后找到每个候选框在feature map上的映射patch
3 与spp layer层不同的是, Fast-RCNN的叫做ROI Pooling(single-level spp layer)
4 最后采用softmax+liner线性回归分类
Faster-RCNN,2015
第1步就与之前不同,不再使用选择性搜索方法(Selective Search)选出那么多的候选框了,而把候选框放在后面的操作中。
1 直接只卷积一次得到整张图的feature map,提出了RPN的方法在feature map上进行滑窗,得到候选框。
目标检测方法演化:
R-CNN Fast RCNN Faster RCNN
50秒 2秒 0.2秒 省时
目标检测扩张内容,转载这篇博客: