CV-1-目标检测-03-RCNN-01-RCNN模型搭建思路.txt

一、将图像使用SS选取候选框ROI,并将ROI图像(2000)保存到磁盘中。
    图像信息:区域图像,区域坐标,ROI区域和GT的IOU值,ROI区域对应的GT的类别ID,tx/ty/tw/th回归转换系数。

二、基于ALexNet的特征提取网络,做模型微调。
    训练数据构建:
        train_x : 区域图像
        train_y: 类别标签ID
            正例:IOU大于等于0.5
            负例:IOU小于0.5

三、SVM分类器的训练数据生成
    使用第二步训练好的ALexNet模型对所有的区域图像进行前向过程的预测,将FC7层的特征输出作为SVM训练的原始特征信息

四、SVM分类器的训练
    训练数据构建:
        train_x : 区域图像所对应的FC7层的高阶特征(4096的向量)
        train_y: 类别标签ID
            正例:GT真实边框
            负例:IOU在[0.1, 0.3]

五、回归模型的训练数据生成
    使用训练的ALexNet模型对所有区域图像进行预测(前向过程),将Conv5层的特征输出作为训练回归模型的原始特征信息。

六、回归模型训练
    训练数据构建:
        train_x : 区域图像所对应的Conv5层的高阶特征
        train_y: 转换系数tx/ty/tw/th
            参与模型训练的数据要求:IOT必须大于0.6



发布了125 篇原创文章 · 获赞 2 · 访问量 2621

猜你喜欢

转载自blog.csdn.net/HJZ11/article/details/104734155