Yolo-V4-Model(pytorch版本)

Y o l o − V 4 − M o d e l ( p y t o r c h 版 本 ) Yolo-V4-Model(pytorch版本) YoloV4Model(pytorch)


anchors相关的信息

anchors = [12,16,19,36,40,28,36,75,76,55,72,146,142,110,192,243,459,401]
[12,16],即[w,h],是一对,三对为一组 [12,16,19,36,40,28] ,对应于76*76的head

anchors_masks = [[6,7,8],[3,4,5],[0,1,2]]
masks中0~8,对应于[12,16]~[459,401]

strides = [32,16,8]
608/32 = 19
608/16 = 38
608/8 = 76


模型最后的预测输出 [tx,ty,tw,th,obj,class]
最后是如何根据预测输出进行画框的
tx,ty 用来确定预测框的中心点
tw,th用来确定anchor框的大小变化
这样就可以画出预测框
obj和class用来作为是否画框的阈值


tx、ty是物体中心点在某网格的偏移距离
tw、th是真实label框groundtruth和anchor框的偏差


结合 y = kx+b理解
y:输出特征图
x:输入特征图
k,b:卷积核


网格原理
1.整体网络使用了全卷积的架构,保留了空间信息(参照感受野理解)
2.每个特征点只负责对应于原图空间位置的物体
3.不同大小的输出头对应网格大小不同
网格大小([608/19,608/38,608/76])


先验框Anchors的原理
tx、ty、tw、th


backbone:提取特征
neck:特征融合
head:


理清loss中赋予每个维度的实际物理意义


YoloV4整体结构网络图

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

一 基础模块


1.Mish激活函数


2.卷积块CBM(conv+batchnorm+mish)


3.CBL(Conv+BN+LeakyRelu)


4.ResN


5.ResUnit


6.SPP(三个最大池化+一个直连+拼接)


7.CSPX(CBM+ResUnit+Concat)


BackBone

Neck和Head

非极大值抑制

Inference

BuildTarget和Loss

Train

DataLoader

猜你喜欢

转载自blog.csdn.net/qq_41375318/article/details/114436562