目标检测——目标检测方法的综述

1、定义：目标检测时图片中对可变数量的目标进行查找和分类。

2、需要解决的问题

1、传统的目标检测方法到深度学习的目标检测方法

发展论述：

对于Overfeat、R-CNN方法，只是利用卷积神经网络进行特征提取，并没有改变搜索框提取目标区域的策略，算法的在速度上仍存在瓶颈。
随着Fast-RCNN的提出，通过RPN网络来代替原始的滑动窗口策略，标志着基于深度学习的目标检测方法，彻底完成了端到端的过程。使得速度和性能得到了很大的提升。
后来不用提取候选框的策略，采用直接回归目标框位置的策略，例如：YOLO、SSD网络，进一步提高了目标检测算法的速度。

2、列举一些代表性的传统的和基于深度学习的目标检测方法

传统的目标检测方法
- Viola-Jones:采用积分图特征+AdaBoost方法对人脸进行检测等。
- HOG+SVM：主要用于行人检测，通过对行人目标候选区域提取HOG特征，并结合SVM分类器来进行判定。
- DPM：是基于HOG特征检测的一种变种，不同的地方在于，DPM中会加入一些额外的策略，来提升检测的精度，而DPM方法是目前非深度学习方法，检测效果最好的，性能最优。在后续的深度学习方法中会用到很多DPM算法中提到的策略，例如包围框策略等。
深度学习的目标检测方法
- One-stage（YOLO和SSD系列的网络）：直接回归出目标框的位置，即不用产生候选框，直接将目标边框定位的问题转化为回归问题。
- Two-stage（Faster RCNN系列的网络）：利用RPN网络对候选区域进行推荐。

3、传统的和基于深度学习的目标检测方法对比

4、目标检测算法的流程（两种）

方法一：给定一幅图片作为输入，通过提取候选框的方法来对候选框进行特征提取，并且利用分类器进行判定，是属于目标或者背景，最后利用NMS(非极大值抑制算法)来进行候选框的合并，得到最终的目标检测结果。

方法二：直接采用特征提取和目标框回归的方法，来进行目标区域的提取，最后同样利用NMS的策略对目标框进行合并，最后输出目标检测的结果。

三、基于深度学习的目标检测方法

以下是目前常用的基于深度学习的目标检测方法