Tensorflow版Faster RCNN源码解析(TFFRCNN) (3)推断(测试)过程使用RPN时代码运行流程

本blog为github上CharlesShang/TFFRCNN版源码解析系列代码笔记第三篇   推断(测试)过程不使用RPN时代码运行流程

作者:Jiang Wu  原文见:https://home.cnblogs.com/u/deeplearning1314/

原因:网上tensorflow版Faster RCNN代码解析较少(猜测是代码调用关系太复杂,没人愿意写),为便于交流学习,本人深入理解代码同时定期更新自己的理解,如有错误敬请指正。(吴疆   2018.7.4)

感谢:网上大神---龙哥为我释疑解惑!

(3)推断(测试)过程使用RPN时代码运行流程

阅读时间: 2018/7/5

代码位置:E:\TFFRCNN\

调用关系:略

代码作用:梳理在使用RPN时代码运行流程,区别上一篇不使用RPN时的情形,运行流程主要涉及的py文件有demo.py、test.py、VGGnet_test.py

主要函数及作用

(1)demo.py函数为实例程序,主函数中首先get_network()获取推断过程要用的网络结果函数(如VGGnet_test()),调用本py文件中定义的demo()函数,

默认情形使用RPN ,同样demo()中主要关注test.py中的im_detect()函数

(2)当使用RPN时bbox=None

  

 首先调用本代码段中_get_blobs(im,boxes)

 

当使用RPN时,cfg.TEST.HAS_RPN为true。首先构造blobs字典,内含data字段、rois字段。

调用_get_image_blob()函数,确定当前im是以长边还是短边缩放,计算当前im的缩放比,默认情况下未使用图像金字塔,返回当前im缩放后的图像组成的blob(构成blobs中的data字段)以及im对应的缩放因子列表(不使用图像金字塔时列表长度为1),由于rois是通过RPN网络产生的,因此blobs中只有data字段有值传回。  

构造blobs中im_info字段(包含当前缩放后图像宽、高、缩放因子)im_blob.shape[0]应为原图像经图像金字塔处理后的图像张数,但使用RPN时不允许使用图像金字塔,因此每张图像缩放后的图像只有一张。构造feed_dict字典,包含blobs的data、im_info字段,与VGGnet_test.py中预先定义的占位符定义维度一一照应,其中data维度为[none,none,none,3],3表示3个图像通道、im_info维度为[none,3]

  

(3)rois的产生

首先需要了解VGGnet_test.py的运行原理,可参考第一篇代码解析。使用RPN时rois是由proposal_layer层产生的,具体产生过程细节后面将会一一进行解读。这里我们主要关注proposal_layer()返回rpn_rois的维度同样与不使用RPN维度时一致,为[none,5]

 

注意:由rpn网络生成proposal的过程需要继续解读proposal_layer_tf.py的源码来分析,后面将会谈到。

猜你喜欢

转载自www.cnblogs.com/deeplearning1314/p/9270695.html