一、将图像使用SS选取候选框ROI,并将ROI图像(2000)保存到磁盘中。
图像信息:区域图像,区域坐标,ROI区域和GT的IOU值,ROI区域对应的GT的类别ID,tx/ty/tw/th回归转换系数。
二、基于ALexNet的特征提取网络,做模型微调。
训练数据构建:
train_x : 区域图像
train_y: 类别标签ID
正例:IOU大于等于0.5
负例:IOU小于0.5
三、SVM分类器的训练数据生成
使用第二步训练好的ALexNet模型对所有的区域图像进行前向过程的预测,将FC7层的特征输出作为SVM训练的原始特征信息
四、SVM分类器的训练
训练数据构建:
train_x : 区域图像所对应的FC7层的高阶特征(4096的向量)
train_y: 类别标签ID
正例:GT真实边框
负例:IOU在[0.1, 0.3]
五、回归模型的训练数据生成
使用训练的ALexNet模型对所有区域图像进行预测(前向过程),将Conv5层的特征输出作为训练回归模型的原始特征信息。
六、回归模型训练
训练数据构建:
train_x : 区域图像所对应的Conv5层的高阶特征
train_y: 转换系数tx/ty/tw/th
参与模型训练的数据要求:IOT必须大于0.6
CV-1-目标检测-03-RCNN-01-RCNN模型搭建思路.txt
猜你喜欢
转载自blog.csdn.net/HJZ11/article/details/104734155
今日推荐
周排行