ImageOpenV4数据集解析

2018.12.11更新：关于ImageOpenV4数据集

上次阅读《百度视觉团队参赛技术解剖》进行的分析。

https://blog.csdn.net/gusui7202/article/details/84259232

原始资料为:https://baijiahao.baidu.com/s?id=1611471635767947365&wfr=spider&for=pc

关于ImageOpenV4，官网：https://storage.googleapis.com/openimages/web/download.html

下载的内容除了图片就是.csv文件。

csv文件对于训练集、测试集都分为三种，以训练集为例，有一下三种：

1.train-images-boxable-with-rotation.csv

里面的每一行主要的部分如下：

【图片id，原图url下载链接，版权信息等等，缩小到100k左右的图像url下载链接】

2.train-annotations-bbox.csv

里面的每一行主要部分如下：

【image_id，XMin,XMax,YMin,YMax（四个归一化坐标）】

3.train-images-boxable.csv

里面的每一行主要部分如下：

【image_name, 原图缩小到几百k大小后的图像url下载链接】

这里需要强调，image_name等于image_id后面加.jpg。而后面链接下载下来的图片名字，去掉.jpg后缀就是图像的id。

直接从官网下的图像，是这里面的图像，也就是缩小过的，并且图像名字去掉后缀就是图像id。

另外，一个图像id对应三个图片，一个是原图，一个是原图缩小一次后的，最后一个是图像缩小之后再缩小。

也就是三个尺寸的图像。大小分别是几个M，几百k，100k左右。我们下的图片，就是几百k的这个，也只有这个的图片名字，才是id，而原图和原图缩小两次后的图片，下载链接都在train-images-boxable-with-rotation.csv（上3点的第1点）中，它们的名字并非图像id。几个文件的关系如下：

几个大小的对比如下：

---------

如果.csv文件太大打不开，可以试试LogView。

感谢 angela0003 的讨论.

----------

ImageOpenV4数据集解析

猜你喜欢