训练CNN时关于数据配比的技巧



当你训练数据中类之前的数据量十分悬殊时(比如Places2, 每个类从400张到3000不等),那么采用以下方法,视频类间平衡。


1) 准备一个类的列表T1。比如place2是401个类,那么该文件就有401行。

2)给每个类准备一个表T2[n],每个表中放属于该类的所有图片。比如place2就有401个这样的表,每个表行数从400到3000不等。

3)每次取图时,先从T1从取得一个类i,然后从对应的T2[i]中取一张图。

4)当T2[i]遍历完后,对其进行洗牌,下次从新的表里取。

5)当T1遍历完后,对其进行洗牌,下次从新的表里取。


参考:

Relay Backpropagation for Effective Learning of Deep Convolutional Neural Networks。Li Shen, Zhouchen Lin, Qingming Huang (Submitted on 18 Dec 2015 (v1), last revised 3 Apr 2016 (this version, v2))

https://arxiv.org/pdf/1512.05830.pdf

猜你喜欢

转载自blog.csdn.net/mao_feng/article/details/77340609
今日推荐