SSD与DSSD要点概述

SSD: Single Shot MultiBox Detector

对YOLO进行改进：
①预测目标的位置：全局特征 → 局部特征
②引入类似Faster RCNN的anchor机制
③在不同尺度的特征图上进行预测

过程：
①将图像固定为300×300（或500×500）大小，送入VGG16网络。
②使用类anchor机制对目标进行预测
（不同特征图尺寸默认比例不同，先预测后微调框的位置和大小）
③得到目标的边框信息和类别。

网络结构：

实验结果：

总结：
SSD结合了YOLO中的回归思想和Faster R-CNN中的anchor机制，使用全图各个位置的多尺度区域特征进行回归，既保持了YOLO速度快的特性，也保证了窗口预测的跟Faster R-CNN一样比较精准，且速度达到58帧每秒（YOLO速度为45帧每秒）。

DSSD : Deconvolutional Single Shot Detector

改进：
①结构：VGG16→Resnet-101
②加入预测模块
③使用反卷积模块

网络结构改进图：

预测模块：

增加残差预测模块
作用：（结果表明）高分辨率图片的检测精度比原始SSD提升明显。
残差网络：解决了退化的问题，更深的网络错误率越小。

反卷积模块：

反卷积：与卷积操作的作用相反，通常用于将低维特征映射成高维输入。
作用：利用反卷积层实现了上下文信息的扩充，提高浅层的表征能力，同时可以提高对小目标的检测能力。

实验结果：

Comparison of Speed & Accuracy on PASCAL VOC2007 test

总结： DSSD将语义信息更丰富的高层卷积特征层和低层卷积特征进行融合，在两类目标上的检测效果有所提升：第一类是小目标以及密集目标，第二类是具有显著背景区分度的目标。
优点：提高了准确率缺点：速度降低明显

详细资料参考：
SSD：
https://blog.csdn.net/u014380165/article/details/72824889
https://blog.csdn.net/u013989576/article/details/73439202/
https://blog.csdn.net/remanented/article/details/79943418

DSSD：
https://blog.csdn.net/u010725283/article/details/79115477/
https://blog.csdn.net/yaoqi_isee/article/details/73277398
https://blog.csdn.net/Jesse_Mx/article/details/55212179

SSD: Single Shot MultiBox Detector

DSSD : Deconvolutional Single Shot Detector

猜你喜欢