ImageOpenV4数据集解析

2018.12.11更新:关于ImageOpenV4数据集

上次阅读《百度视觉团队参赛技术解剖》进行的分析。

https://blog.csdn.net/gusui7202/article/details/84259232

原始资料为:https://baijiahao.baidu.com/s?id=1611471635767947365&wfr=spider&for=pc

关于ImageOpenV4,官网:https://storage.googleapis.com/openimages/web/download.html

下载的内容除了图片就是.csv文件。

csv文件对于训练集、测试集都分为三种,以训练集为例,有一下三种:

1.train-images-boxable-with-rotation.csv 

里面的每一行主要的部分如下:

【图片id,原图url下载链接,版权信息等等,缩小到100k左右的图像url下载链接】

2.train-annotations-bbox.csv

里面的每一行主要部分如下:

【image_id,XMin,XMax,YMin,YMax(四个归一化坐标)】

3.train-images-boxable.csv

里面的每一行主要部分如下:

【image_name,  原图缩小到几百k大小后的图像url下载链接】

这里需要强调,image_name等于image_id后面加.jpg。而后面链接下载下来的图片名字,去掉.jpg后缀就是图像的id。

直接从官网下的图像,是这里面的图像,也就是缩小过的,并且图像名字去掉后缀就是图像id。

另外,一个图像id对应三个图片,一个是原图,一个是原图缩小一次后的,最后一个是图像缩小之后再缩小。

也就是三个尺寸的图像。大小分别是几个M,几百k,100k左右。我们下的图片,就是几百k的这个,也只有这个的图片名字,才是id,而原图和原图缩小两次后的图片,下载链接都在train-images-boxable-with-rotation.csv(上3点的第1点)中,它们的名字并非图像id。几个文件的关系如下:

几个大小的对比如下:

---------

如果.csv文件太大打不开,可以试试LogView。

感谢 angela0003 的讨论.

----------

猜你喜欢

转载自blog.csdn.net/gusui7202/article/details/84961836