VOC2012和VOC2007的下载地址:
https://pjreddie.com/projects/pascal-voc-dataset-mirror/
- Annotations文件夹
- 该文件下存放的是xml格式的标签文件,每个xml文件都对应于JPEGImages文件夹的一张图片。
- 这是最重要的,保存重要的位置信息
- size 是图片的信息
- object 是物体名称信息
- bndbox 是物体Xmin,Ymin,Xmin,Ymax的信息
<annotation> <folder>VOC2007</folder> <filename>000001.jpg</filename> <source> <database>My Database</database> <annotation>VOC2007</annotation> <image>flickr</image> <flickrid>NULL</flickrid> </source> <owner> <flickrid>NULL</flickrid> <name>QQ974573656</name> </owner> <size> <width>500</width> <height>375</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <name>person</name> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <xmin>213</xmin> <ymin>155</ymin> <xmax>283</xmax> <ymax>374</ymax> </bndbox> </object> </annotation>
- JPEGImages文件夹
- 改文件夹下存放的是数据集图片,包括训练和测试图片。
- 以上两个是最重要的信息
- ImageSets文件夹
- 该文件夹下存放了三个文件,分别是Layout、Main、Segmentation。在这里我们只用存放图像数据的Main文件,其他两个暂且不管。
- 主要是main文件夹中的信息
- 这里train_test.txt放着的是要训练的图片文件名
- test.txt放着的是测试的的图片文件名
- 物品名_test.txt这边用来计算识别的准确率。(1表示有,0表示不好识别,-1表示没有)
- SegmentationClass文件和SegmentationObject文件。
- 这两个文件都是与图像分割相关
- 对目标检测没有什么用处