文章目录
简介MNIST数据集
一,官网地址以及下载方法
1.官方地址
http://yann.lecun.com/exdb/mnist/
2.下载方法
①手动下载
可在这里下载:
如果下载不了,
也可在我的百度网盘下载:
链接:https://pan.baidu.com/s/1_PUxvfIP1mM452gbQJmB_Q 提取码:scfy
②用tensorflow自动下载
见这篇文章:
- 链接
二,浅谈MNIST数据集
MNIST数据集是一个开源的训练数据集,它来自美国高中生和研究院手写数字最终生成的图片组成,并且以特殊的格式保存,易于程序读取!
It is a subset of a larger set available from NIST.—摘自官网
1.图片样式
①大小
28×28Pixel,即每幅图就是一行784(28×28)列的数据
②数值
若为黑白图,则每个元素用0~255区分颜色的深度
若为彩色图:由RGB(红黄蓝)三个值表示
③内容
在实际的机器学习模型时,样本一般被分为三类:
- 一部分用于训练(训练数据集mnist.train,55000张图)
- 一部分用于评估模型的准确度(测试数据集test.images,10000张图)
- 一部分用于评估最终模型的准确度(验证数据集mnist.validation,5000张图)
三,MNIST数据集测试代码实例
1.代码
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
print ('输入数据打印:',mnist.train.images)
print ('输入数据打印shape:',mnist.train.images.shape)
import pylab
im = mnist.train.images[1]
im = im.reshape(-1,28)
pylab.imshow(im)
pylab.show()
print ('输入数据打印shape:',mnist.test.images.shape)
print ('输入数据打印shape:',mnist.validation.images.shape)
2.输出信息
序号 | 内容 |
---|---|
1 | 解压数据集 |
2 | 打印解压的图片信息 |
3 | 打印图片shape |
4 | 显示训练集中的图-序号1 |
5 | 打印测试数据集与验证数据shape |
有关shape(形状)的介绍:https://blog.csdn.net/RObot_123/article/details/103102627