在win10 tensorflow ssd的学习过程中,从其他地方看到:trainval_percent代表交叉验证集占总图片的比例,train_percent是训练集占交叉验证集的比例。即tensorflow ssd里pascalvoc_2007.py文件中的这个参数如何确定,参数如下:
SPLITS_TO_SIZES = {
'train': 5011,
'test': 4952,
}
参考意见:
1参考:https://www.cnblogs.com/pacino12134/p/10415157.html
ImageSets\Main里的四个txt文件
在ImageSets里再新建文件夹,命名为Main,在Main文件夹中生成四个txt文件,即:
test.txt是测试集
train.txt是训练集
val.txt是验证集
trainval.txt是训练和验证集
VOC2007中,trainval大概是整个数据集的50%,test也大概是整个数据集的50%;train大概是trainval的50%,val大概是trainval的50%。
txt文件中的内容为样本图片的名字(不带后缀),格式如下:
根据已生成的xml,制作VOC2007数据集中的trainval.txt ; train.txt ; test.txt ; val.txt
trainval占总数据集的50%,test占总数据集的50%;train占trainval的50%,val占trainval的50%;
上面所占百分比可根据自己的数据集修改,如果数据集比较少,test和val可少一些