MNIST数据集转化为CSV格式 - 代码天地

MNIST数据集转化为CSV格式

其他 2018-08-06 13:26:23 阅读次数: 0

MNIST数据集是一个手写识别数据集，机器学习基础的数据集，其原始数据集以字节形式存储，包含四个部分：

训练集images: train-images-idx3-ubyte.gz (包含60000个样本)
训练集labels: train-labels-idx1-ubyte.gz (包含60000个标签)
测试集images: t10k-images-idx3-ubyte.gz (包含10000个样本)
测试集labels: t10k-labels-idx1-ubyte.gz (包含10000个标签)

学习过程中，原始的数据格式不太习惯，遂根据相关资料，将其转化为csv格式，分别存储在mnist_train.csv，mnist_test.csv两个文件中，供学习使用。

MNIST数据集下载：

http://yann.lecun.com/exdb/mnist/ 或 https://download.csdn.net/download/albert201605/10340814

转化方法：下载原始数据后，置于工程目录下，解压，运行以下代码即可。

def convert(imgf, labelf, outf, n):
    f = open(imgf, "rb")
    o = open(outf, "w")
    l = open(labelf, "rb")

    f.read(16)
    l.read(8)
    images = []

    for i in range(n):
        image = [ord(l.read(1))]
        for j in range(28*28):
            image.append(ord(f.read(1)))
        images.append(image)

    for image in images:
        o.write(",".join(str(pix) for pix in image)+"\n")
    f.close()
    o.close()
    l.close()

convert("MNIST/train-images.idx3-ubyte", "MNIST/train-labels.idx1-ubyte",
        "mnist_train.csv", 60000)
convert("MNIST/t10k-images.idx3-ubyte", "MNIST/t10k-labels.idx1-ubyte",
        "mnist_test.csv", 10000)

print("Convert Finished!")

参考：

猜你喜欢

转载自blog.csdn.net/Albert201605/article/details/79893585

MNIST数据集转化为CSV格式

Mnist数据集将其转化为图片

【Python】将MNIST数据集转化为图片

数据集制作之xml文件转化为csv

mnist csv格式数据

Pascal VOC数据集转化为COCO数据集格式

PASCAL VOC 数据集转化为yolo数据集格式

将json格式数据集转化为record格式

将MNIST数据集转换为csv格式

COCO数据集提取某类并转化为VOC格式

jsonp格式的数据转化为json格式

将自己手动标注的数据集(PascalVOC格式)转化为.TFRecord格式

字典型列表转化为csv文件格式

MNIST数据集的格式转换

visdrone2019转化为coco格式数据集（包含DET和VID）

记录Open Image v4数据集转化为VOC格式

SBD数据集(VOC2021扩展数据集)mat格式转化为png，以及可视化

将UCCS数据集转化为VOC数据集

CSV转化为xlxs文件

yolo数据格式转化为coco数据格式

将xml格式数据转化为record格式

MNIST数据集的格式以及读取方式

YOLO分割数据集制作：使用Labelme工具制作分割数据集(.json)并转化为YOLO的数据集的格式(.txt)

mnist数据集转换成图片和csv文档

mnist数据集转换成图片和csv文档

将SqlDataReader 数据集转化为datatbale ,在将datatable 转化为iList

0028-人脸数据widerface数据转化为yolo格式

Labelme标注的json数据转化为coco格式的数据

Python 将csv文件里的某一列时间戳转化为想要的时间格式

MINST数据集转换为CSV格式

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)