物体识别现有方法的对比和比较

物体识别流程：RCNN-> SppNET->fast RCNN->faster RCNN

https://www.cnblogs.com/skyfsm/p/6806246.html

http://www.cnblogs.com/gongxijun/p/7071509.html

RCNN

1.先将IL SVRC2012数据集训练练成一个1000类的分类器模型，并将模型保存下来，一般使用Alexnet

2.使用1中的模型，使用这个模型中的参数来初始化CNN中的参数，并使用那些经过变形的区域目标来训练模型。目标区域是指经过SS算法提取到的区域目标和我们标注的目标区域的期票，[两张图片的交集/两张图片的并集]“0.5时，定义为正样本，否则为负样本，每一个SGD（随机梯度算法），我们使用一个128的小批次，使用32个当前样本，96个背景样本作为负样本。

3.外联一个全连接层，输出通过支持向量机，进行分类，例如1000个特征对应于正样本

SS算法

选择性搜索是一种用于目标检测的区域推荐算法。它的设计速度快，召回率高。它是根据颜色，纹理，大小和形状的兼容性，计算相似区域的层次分组

图片的转换：

方法一：在原始区域目标取一块区域进行等比缩放到CNN需要的图片大小

方法二：去除原始目标，然后对目标区域进行补充，在等比缩放到需要的大小

方法三：直接把原始图片等比缩放到需要的大小

预测目标区域：在测试时，我们使用SS算法在每一张图片上提取大约2000个区域目标，对每一个图片放入到CNN提取特征向量，对每一个类，使用SVM打分

为什么不使用sofamaxer

边框回归

P是预测区域，G是实际区域

缺点：

1，多个候选区域需要预先提取，占用很大的磁盘空间

2，针对传统的CNN需要固定的尺寸大小的输入图像，会对物体产生截断或拉伸

SPP-net

物体识别现有方法的对比和比较

猜你喜欢