物体识别流程:RCNN-> SppNET->fast RCNN->faster RCNN
https://www.cnblogs.com/skyfsm/p/6806246.html
http://www.cnblogs.com/gongxijun/p/7071509.html
RCNN
1.先将IL SVRC2012数据集训练练成一个1000类的分类器模型,并将模型保存下来,一般使用Alexnet
2.使用1中的模型,使用这个模型中的参数来初始化CNN中的参数,并使用那些经过变形的区域目标来训练模型。目标区域是指经过SS算法提取到的区域目标和我们标注的目标区域的期票,[两张图片的交集/两张图片的并集]“0.5时,定义为正样本,否则为负样本,每一个SGD(随机梯度算法),我们使用一个128的小批次,使用32个当前样本,96个背景样本作为负样本。
3.外联一个全连接层,输出通过支持向量机,进行分类,例如1000个特征对应于正样本
SS算法
选择性搜索是一种用于目标检测的区域推荐算法。它的设计速度快,召回率高。它是根据颜色,纹理,大小和形状的兼容性,计算相似区域的层次分组
图片的转换:
方法一:在原始区域目标取一块区域进行等比缩放到CNN需要的图片大小
方法二:去除原始目标,然后对目标区域进行补充,在等比缩放到需要的大小
方法三:直接把原始图片等比缩放到需要的大小
预测目标区域:在测试时,我们使用SS算法在每一张图片上提取大约2000个区域目标,对每一个图片放入到CNN提取特征向量,对每一个类,使用SVM打分
为什么不使用sofamaxer
边框回归
P是预测区域,G是实际区域
缺点:
1,多个候选区域需要预先提取,占用很大的磁盘空间
2,针对传统的CNN需要固定的尺寸大小的输入图像,会对物体产生截断或拉伸
SPP-net