Yolo-V4-Model(pytorch版本)

$Y o l o - V 4 - M o d e l (p y t o r c h 版本)$

anchors相关的信息

anchors = [12,16,19,36,40,28,36,75,76,55,72,146,142,110,192,243,459,401]
[12,16]，即[w,h]，是一对，三对为一组 [12,16,19,36,40,28] ,对应于76*76的head

anchors_masks = [[6,7,8],[3,4,5],[0,1,2]]
masks中0~8，对应于[12,16]~[459,401]

strides = [32,16,8]
608/32 = 19
608/16 = 38
608/8 = 76

模型最后的预测输出 [tx,ty,tw,th,obj,class]
最后是如何根据预测输出进行画框的
tx,ty 用来确定预测框的中心点
tw,th用来确定anchor框的大小变化
这样就可以画出预测框
obj和class用来作为是否画框的阈值

tx、ty是物体中心点在某网格的偏移距离
tw、th是真实label框groundtruth和anchor框的偏差

结合 y = kx+b理解
y:输出特征图
x:输入特征图
k,b：卷积核

网格原理
1.整体网络使用了全卷积的架构，保留了空间信息（参照感受野理解）
2.每个特征点只负责对应于原图空间位置的物体
3.不同大小的输出头对应网格大小不同
网格大小（[608/19，608/38，608/76]）

先验框Anchors的原理
tx、ty、tw、th

backbone：提取特征
neck：特征融合
head:

理清loss中赋予每个维度的实际物理意义

YoloV4整体结构网络图

在这里插入图片描述

Yolo-V4-Model(pytorch版本)

$Y o l o - V 4 - M o d e l (p y t o r c h 版本)$

YoloV4整体结构网络图

一基础模块

1.Mish激活函数

2.卷积块CBM(conv+batchnorm+mish)

3.CBL（Conv+BN+LeakyRelu）

4.ResN

5.ResUnit

6.SPP(三个最大池化+一个直连+拼接)

7.CSPX（CBM+ResUnit+Concat）

二 BackBone

三 Neck和Head

四非极大值抑制

五 Inference

六 BuildTarget和Loss

七 Train

八 DataLoader

猜你喜欢

Yolo-V4-Model(pytorch版本)

Y o l o − V 4 − M o d e l ( p y t o r c h 版 本 ) Yolo-V4-Model(pytorch版本) Yolo−V4−Model(pytorch版本)

YoloV4整体结构网络图

一 基础模块

1.Mish激活函数

2.卷积块CBM(conv+batchnorm+mish)

3.CBL（Conv+BN+LeakyRelu）

4.ResN

5.ResUnit

6.SPP(三个最大池化+一个直连+拼接)

7.CSPX（CBM+ResUnit+Concat）

二 BackBone

三 Neck和Head

四 非极大值抑制

五 Inference

六 BuildTarget和Loss

七 Train

八 DataLoader

猜你喜欢

$Y o l o - V 4 - M o d e l (p y t o r c h 版本)$

一基础模块

四非极大值抑制