计算机视觉 数据集

belme:数据集中包含大量有标注的图像数据。
ImageNet: 是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像URL被ImageNet手动注释。根据 WordNet 层次结构来组织,其中层次结构的每个节点都由成百上千个图像来描述。
LSUN:场景理解与许多辅助任务(房间布局估计,显着性预测等)
MS COCO:通用图像的理解和文字描述。
COIL 100:在 360 度旋转中以各个角度成像的 100 个不同的物体。
视觉基因组:非常详细的视觉知识库,配以0 万张带有文字描述的图像。
谷歌的Open Images:“知识共享”(Creative Commons)下的900万个图像网址集合,已标注超过6,000个类别的标签。
Labelled Faces in the Wild:13,000个人脸标记图像,用于开发涉及面部识别的应用程序。
Stanford Dogs Dataset:包含20580张图片和120个不同的狗品种类别。
室内场景识别(Indoor Scene Recognition):这是一个非常细化的数据集,由于大多数在“户外”场景中表现良好的场景识别模型在室内表现不佳,因而这个数据集非常有用。内有 67 个室内类别,共 15,620 张图像

猜你喜欢

转载自blog.csdn.net/weixin_44356285/article/details/86421133