王权富贵：VOC2007数据集格式详解和下载

VOC2012和VOC2007的下载地址：

https://pjreddie.com/projects/pascal-voc-dataset-mirror/

Annotations文件夹

该文件下存放的是xml格式的标签文件，每个xml文件都对应于JPEGImages文件夹的一张图片。
这是最重要的，保存重要的位置信息
size 是图片的信息
object 是物体名称信息
- bndbox 是物体Xmin,Ymin,Xmin,Ymax的信息

<annotation>
    <folder>VOC2007</folder>
    <filename>000001.jpg</filename>
    <source>
        <database>My Database</database>
        <annotation>VOC2007</annotation>
        <image>flickr</image>
        <flickrid>NULL</flickrid>
    </source>
    <owner>
        <flickrid>NULL</flickrid>
        <name>QQ974573656</name>
    </owner>
    <size>
        <width>500</width>
        <height>375</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented>
    <object>
        <name>person</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>213</xmin>
            <ymin>155</ymin>
            <xmax>283</xmax>
            <ymax>374</ymax>
        </bndbox>
    </object>
</annotation>

JPEGImages文件夹

改文件夹下存放的是数据集图片，包括训练和测试图片。

以上两个是最重要的信息

ImageSets文件夹

该文件夹下存放了三个文件，分别是Layout、Main、Segmentation。在这里我们只用存放图像数据的Main文件，其他两个暂且不管。

主要是main文件夹中的信息

这里train_test.txt放着的是要训练的图片文件名

test.txt放着的是测试的的图片文件名

物品名_test.txt这边用来计算识别的准确率。（1表示有，0表示不好识别，-1表示没有）

SegmentationClass文件和SegmentationObject文件。

这两个文件都是与图像分割相关

对目标检测没有什么用处

王权富贵：VOC2007数据集格式详解和下载

猜你喜欢