警告!这只是一个初心者的认识记录,文章不具有参考价值。
- Yolo是什么?
一种深度神经网络(detection network)
detection network
1,Faster RCNN/SPP-Net先找位置再做类别
2,YOLO=每个格子提出region proposal并做分类
优劣:
RCNN家族精度高,速度慢;
YOLO/SSD家族精度低,速度快。
2,YOLO原理(you only look once)
GoogleNet+ 4个卷积+ 2个全连接层
流程:
0,resize the pic 输入CCN网络
1,将图片分成7*7*30个网格,每7*7中的单元格圈出2个候选框
2,筛选候选物体,得到较好的候选框
3,输出物体框
1,单元格(grid cell)
1,7*7=49个单元格,每个单元格深度为30
2,每个单元格预测一个物体类别,并且预测物体的概率值
3,候选框值:xmax,ymax,xmin,ymin,confidence(置信度)
4,深度:
2个BBOX(xmax,ymax,xmin,ymin,confidence)——10个
20类的预测概率结果——20个
10+20=30
2,网格输出筛选
一个网格预测2个Bbox(Bounding box),但训练时只有confidence score 较大的Bbox会被使用,并且上述的20类的预测概率结果代表一个Bbox
2,学习路线
- python &cpp学习
- 机器学习
- 深度学习
- Pytorch框架
- 计算机视觉
- 部分RCNN基础,yolo