deeplearning.ai 总结 - YOLO算法输出维度的计算方法

deeplearning.ai 总结 - YOLO算法输出维度的计算方法

flyfish

p c 表示矩形区域是目标的概率,数值在0~1之间
b x , b y 表示目标中心位置坐标
b h , b w 表示目标所在矩形区域的高和宽
c 表示表示类别,有多少个类别就有多少个 c

图片左上角为原点 ( 0 , 0 ) ,右下角为 ( 1 , 1 )

输出内容的列向量中先要包含以下6个部分
( p c , b x , b y , b h , b w , c )
这里写图片描述

如果要同时检测两个目标,就设置两个Anchor Boxes
例如Anchor box 1检测人,Anchor box 2检测车。

计算方法

例如我们将图片分割成3*3的网格,算法可以识别3类目标(pedestrian, car, motorcycle),我们有两个Anchor Boxes

那么输出维度是
3*3*(5+3)*2

这里写图片描述
按照上图计算
就是
19*19*(5+80)5

猜你喜欢

转载自blog.csdn.net/flyfish1986/article/details/79923250