CV-1-目标检测-03-RCNN-01-RCNN模型搭建思路.txt

一、将图像使用SS选取候选框ROI，并将ROI图像(2000)保存到磁盘中。
    图像信息：区域图像，区域坐标，ROI区域和GT的IOU值，ROI区域对应的GT的类别ID，tx/ty/tw/th回归转换系数。

二、基于ALexNet的特征提取网络，做模型微调。
    训练数据构建：
        train_x : 区域图像
        train_y: 类别标签ID
            正例：IOU大于等于0.5
            负例：IOU小于0.5

三、SVM分类器的训练数据生成
    使用第二步训练好的ALexNet模型对所有的区域图像进行前向过程的预测，将FC7层的特征输出作为SVM训练的原始特征信息

四、SVM分类器的训练
    训练数据构建：
        train_x : 区域图像所对应的FC7层的高阶特征（4096的向量）
        train_y: 类别标签ID
            正例：GT真实边框
            负例：IOU在[0.1, 0.3]

五、回归模型的训练数据生成
    使用训练的ALexNet模型对所有区域图像进行预测（前向过程），将Conv5层的特征输出作为训练回归模型的原始特征信息。

六、回归模型训练
    训练数据构建：
        train_x : 区域图像所对应的Conv5层的高阶特征
        train_y: 转换系数tx/ty/tw/th
            参与模型训练的数据要求：IOT必须大于0.6

HJZ11

发布了125 篇原创文章 · 获赞 2 · 访问量 2621

私信关注

CV-1-目标检测-03-RCNN-01-RCNN模型搭建思路.txt

猜你喜欢