2018.12.11更新:关于ImageOpenV4数据集
上次阅读《百度视觉团队参赛技术解剖》进行的分析。
https://blog.csdn.net/gusui7202/article/details/84259232
原始资料为:https://baijiahao.baidu.com/s?id=1611471635767947365&wfr=spider&for=pc
关于ImageOpenV4,官网:https://storage.googleapis.com/openimages/web/download.html
下载的内容除了图片就是.csv文件。
csv文件对于训练集、测试集都分为三种,以训练集为例,有一下三种:
1.train-images-boxable-with-rotation.csv
里面的每一行主要的部分如下:
【图片id,原图url下载链接,版权信息等等,缩小到100k左右的图像url下载链接】
2.train-annotations-bbox.csv
里面的每一行主要部分如下:
【image_id,XMin,XMax,YMin,YMax(四个归一化坐标)】
3.train-images-boxable.csv
里面的每一行主要部分如下:
【image_name, 原图缩小到几百k大小后的图像url下载链接】
这里需要强调,image_name等于image_id后面加.jpg。而后面链接下载下来的图片名字,去掉.jpg后缀就是图像的id。
直接从官网下的图像,是这里面的图像,也就是缩小过的,并且图像名字去掉后缀就是图像id。
另外,一个图像id对应三个图片,一个是原图,一个是原图缩小一次后的,最后一个是图像缩小之后再缩小。
也就是三个尺寸的图像。大小分别是几个M,几百k,100k左右。我们下的图片,就是几百k的这个,也只有这个的图片名字,才是id,而原图和原图缩小两次后的图片,下载链接都在train-images-boxable-with-rotation.csv(上3点的第1点)中,它们的名字并非图像id。几个文件的关系如下:
几个大小的对比如下:
---------
如果.csv文件太大打不开,可以试试LogView。
感谢 angela0003 的讨论.
----------