Python: 自动将Faster数据集分随机为trainval、test、val、train - 代码天地

Python: 自动将Faster数据集分随机为trainval、test、val、train

其他 2018-10-22 20:11:12 阅读次数: 0

2018.10.20

trainval_num与train_num为比例。

set(a).difference(set(b)) 求差集

random.shuffle()打乱数据，有返回。

math.floor向下取整。

random.sample(a,b)：在a中随机采样b个元素。

os.listdir()生成文件夹下文件名称列表。

"""
https://blog.csdn.net/gusui7202/article/details/83239142
qhy。
"""
# -*- coding: utf -*-
import os
import random
import math
fo1=open('H:/qhy_database/Dataset_009/VOC2007/ImageSets/Main/test.txt','w')
fo2=open('H:/qhy_database/Dataset_009/VOC2007/ImageSets/Main/trainval.txt','w')
fo3=open('H:/qhy_database/Dataset_009/VOC2007/ImageSets/Main/train.txt','w')
fo4=open('H:/qhy_database/Dataset_009/VOC2007/ImageSets/Main/val.txt','w')
filepath='H:/qhy_database/Dataset_009/VOC2007/Annotations'
filelist=os.listdir(filepath)
file_name=[]
for w in filelist:
    file_name.append(w.replace('.xml',''))
file_num=len(file_name)
trainval_num=0.8
train_num=0.8
#trainval
trainval_list=random.sample(range(file_num),math.floor(trainval_num*file_num))
#test
test_list=(list(set(range(file_num)).difference(set(trainval_list))))
random.shuffle(test_list)
#train
train_list=random.sample(trainval_list,math.floor(train_num*len(trainval_list)))
#val
val_list=list(set(trainval_list).difference(set(train_list)))
random.shuffle(val_list)
#put in txt
for i in trainval_list:
    fo2.write(file_name[i]+'\n')
for i in test_list:
    fo1.write(file_name[i]+'\n')
for i in train_list:
    fo3.write(file_name[i]+'\n')
for i in val_list:
    fo4.write(file_name[i]+'\n')
fo1.close()
fo2.close()
fo3.close()
fo4.close()

猜你喜欢

转载自blog.csdn.net/gusui7202/article/details/83215632

Python: 自动将Faster数据集分随机为trainval、test、val、train

最简单的Python数据集分割：将Dataframe自由分割成指定大小的test和train

PASCAL VOC数据集训练集、验证集、测试集的划分和提取，得到test.txt、train.txt、trainval.txt、val.txt文件代码

制作PASCAL VOC格式的检测数据集，生成trainval.txt, train.txt, val.txt, test.txt文件

【ImageSets文件夹】Pascal VOC数据集格式文件夹中test.txt、train.txt、trainval.txt、val.txt文件生成

VOC格式数据集制作：ImageSets-＞Segmentation文件中的train.txt，test.txt，trainval.txt，val.txt详细制作

train.txt---val.txt---trainval.txt---test.txt 生成

caffe中train过程的train数据集、val数据集、test时候的test数据集区别

python自动划分txt文件数据的train_date和test_date

YOLOv5数据集划分脚本(train、val、test)

制作PASCAL VOC格式的分割数据集，生成trainval.txt, train.txt, val.txt文件

随机创建train val test 等文件

python读取数据集文件下所有文件并打乱划分生成训练测试txt文件（生成train.txt、test.txt，顺序随机，默认比例8:2）

sklearn数据集随机切分（train_test_split）

python中的train_test_split方法

python中train_test_split()

scikit-learn用train_test_split随机划分数据集和训练集

python 将数据对象存储为文件

paddleseg数据集自定义比例划分为测试集test.txt，训练集train.txt，验证集val.txt

Python数据集切分

python 随机抽取数据

机器学习中样本非随机分布时,创建train val test 等文件过程

python test

Test Python

Python笔记——cross_validation模块、train_test_split

sklearn.model_selection.train_test_split 将数据集分为8:2

python：将训练得到的loss、train_acc等数据写入csv文件

在python的Scikit-learn库中，可以使用train_test_split函数来划分训练集和测试集。

Python——将python项目打包为exe

Ubuntu 16.0.4 + GPU + caffe + python + py-faster-rcnn下Faster-RCNN训练自己的数据集(交替优化训练)

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)