SSD与DSSD要点概述

SSD: Single Shot MultiBox Detector

对YOLO进行改进:
①预测目标的位置:全局特征 → 局部特征
②引入类似Faster RCNN的anchor机制
③在不同尺度的特征图上进行预测

过程:
①将图像固定为300×300(或500×500)大小,送入VGG16网络。
②使用类anchor机制对目标进行预测
(不同特征图尺寸默认比例不同,先预测后微调框的位置和大小)
③得到目标的边框信息和类别。


网络结构:

实验结果:

总结:
SSD结合了YOLO中的回归思想和Faster R-CNN中的anchor机制,使用全图各个位置的多尺度区域特征进行回归,既保持了YOLO速度快的特性,也保证了窗口预测的跟Faster R-CNN一样比较精准,且速度达到58帧每秒(YOLO速度为45帧每秒)。


DSSD : Deconvolutional Single Shot Detector

改进:
①结构:VGG16→Resnet-101
②加入预测模块
③使用反卷积模块


网络结构改进图:

预测模块:

增加残差预测模块
作用:(结果表明)高分辨率图片的检测精度比原始SSD提升明显。
残差网络:解决了退化的问题,更深的网络错误率越小。


反卷积模块:

反卷积:与卷积操作的作用相反,通常用于将低维特征映射成高维输入。
作用:利用反卷积层实现了上下文信息的扩充,提高浅层的表征能力,同时可以提高对小目标的检测能力。


实验结果:

Comparison of Speed & Accuracy on PASCAL VOC2007 test

总结: DSSD将语义信息更丰富的高层卷积特征层和低层卷积特征进行融合,在两类目标上的检测效果有所提升:第一类是小目标以及密集目标,第二类是具有显著背景区分度的目标。
优点:提高了准确率 缺点:速度降低明显

详细资料参考:
SSD:
https://blog.csdn.net/u014380165/article/details/72824889
https://blog.csdn.net/u013989576/article/details/73439202/
https://blog.csdn.net/remanented/article/details/79943418

DSSD:
https://blog.csdn.net/u010725283/article/details/79115477/
https://blog.csdn.net/yaoqi_isee/article/details/73277398
https://blog.csdn.net/Jesse_Mx/article/details/55212179

猜你喜欢

转载自blog.csdn.net/as6689093/article/details/83041406
ssd