物体识别现有方法的对比和比较

物体识别流程:RCNN-> SppNET->fast RCNN->faster RCNN

https://www.cnblogs.com/skyfsm/p/6806246.html

http://www.cnblogs.com/gongxijun/p/7071509.html

RCNN     

1.先将IL SVRC2012数据集训练练成一个1000类的分类器模型,并将模型保存下来,一般使用Alexnet

2.使用1中的模型,使用这个模型中的参数来初始化CNN中的参数,并使用那些经过变形的区域目标来训练模型。目标区域是指经过SS算法提取到的区域目标和我们标注的目标区域的期票,[两张图片的交集/两张图片的并集]“0.5时,定义为正样本,否则为负样本,每一个SGD(随机梯度算法),我们使用一个128的小批次,使用32个当前样本,96个背景样本作为负样本。

3.外联一个全连接层,输出通过支持向量机,进行分类,例如1000个特征对应于正样本

SS算法

选择性搜索是一种用于目标检测的区域推荐算法。它的设计速度快,召回率高。它是根据颜色,纹理,大小和形状的兼容性,计算相似区域的层次分组

图片的转换:

方法一:在原始区域目标取一块区域进行等比缩放到CNN需要的图片大小

方法二:去除原始目标,然后对目标区域进行补充,在等比缩放到需要的大小

方法三:直接把原始图片等比缩放到需要的大小

预测目标区域:在测试时,我们使用SS算法在每一张图片上提取大约2000个区域目标,对每一个图片放入到CNN提取特征向量,对每一个类,使用SVM打分

为什么不使用sofamaxer

边框回归

P是预测区域,G是实际区域


缺点:

1,多个候选区域需要预先提取,占用很大的磁盘空间

2,针对传统的CNN需要固定的尺寸大小的输入图像,会对物体产生截断或拉伸


 SPP-net



猜你喜欢

转载自blog.csdn.net/baidu_38375121/article/details/80429773