下面用一个具体的例子体会TensorFlow中的数据读取,如下图所示,假设当前文件夹中已经有1.png,2.png,3.png三张图片,希望读取的这三张图片的5个epoch,并把读取的结果重新存到read文件夹中。
代码如下(对应的文件为test1.py)
import tensorflow as tf #新建一个Session with tf.Session() as sess: #要读取的三张图片 filename = ['1.png','2.png','3.png'] #string_input_producer会产生一个文件名队列 filename_queue = tf.train.string_input_producer(filename,shuffle=False,num_epochs=5) #reader从文件名列表中读取数据,对应方法为reader.read reader=tf.WholeFileReader() key,value = reader.read(filename_queue) #tf.train.string_input_producer定义了一个epoch变量,要对他进行初始化 tf.local_variables_initializer().run() #使用start_queue_runners之后,才会开始填充队列 threads=tf.train.start_queue_runners(sess=sess) i=0 while True: i += 1 #获取图片数据并保存 image_data = sess.run(value) with open('read/test1_%d.png' % i, 'wb')as f: f.write(image_data)
运行代码后,(程序最后会抛出一个OutOfRangeError异常,不必担心,这就是epoch跑完,队列关闭的标志),得到read文件夹中的图片,正好是按顺序的5个epoch,如下图所示
如果设置 filename_queue = tf.train.string_input_producer(filename,shuffle=False,num_epochs=5)中的shuffle=True,那么在每个epoch内图像会被打乱