PASCAL VOC数据集格式文件夹下文件配置

日常防止遗忘系列。目标检测必备知识。

在这里插入图片描述

JPEGImages 文件夹
该文件夹下存放着所有的训练集图片,格式都是.jpg

需要注意的是命名格式,虽然对命名没有特别要求,但是最好按照官方的命名方法,如000001.jpg,000123.jpg,然后在这个文件夹里就没有其他东西了。
Annotations 文件夹
该文件夹下存放的是每一个图片的标注信息,文件都是.xml格式,文件名和图片名是一致的对于该xml的格式,可以参考一下示例:

以上是使用标注工具标注的人脸,(在下面会提到,自己写的一个比较简陋的标注工具 ^^),该图片的名字是000001.jpg
然后会在Annotations文件夹下面生成一个000001.xml文件与之对应:

VOCType
000001.jpg

VOC


485
324
3

0

face
Unspecified
0
0

287
57
351
150



这是一个基本的格式,其中的object标签保存的就是目标(实例、对象)的标签信息与位置信息,对于一个图片里面有多个目标(实例、对象)的话,在该xml中就有多个object。然后Annotations文件夹里面就是这样的一堆xml文件,其他没什么。
ImageSets 文件夹
在这个文件夹中还有一个Main文件夹,其他的文件夹不太重要(对于我目前的需求来说),这个文件夹中主要有三个.txt文件,分别是train.txt、test.txt、val.txt

test.txt中保存的是测试所用的所有样本的名字,不过没有后缀(下同),一般测试的样本数量占总数据集的20%
train.txt中保存的是训练所用的样本名,样本数量通常占60%左右
val.txt中保存的是验证所用的样本名,数量占20%左右
当然这个比例可以自己决定。

猜你喜欢

转载自blog.csdn.net/Dongjiuqing/article/details/126618048