tf学习(七)—— CNN-MNIST实例学习分析

程序

程序为转载的,如下

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data
mnist=input_data.read_data_sets("MNIST-data",one_hot=True)


#每个批次的大小
batch_size=100
#计算一共有多少个批次
n_batch=mnist.train.num_examples//batch_size


#初始化权值
def weight_variable(shape):
    initial=tf.truncated_normal(shape,stddev=0.1)#生成一个截断的正态分布,
                                       # shape表示生成张量的维度
    return tf.Variable(initial)  #tf.Variable()函数用来变量声明


#初始化偏置
def bias_variable(shape):
    initial=tf.constant(0.1,shape=shape)  #constant 为常量
    return tf.Variable(initial)


#卷积层
def conv2d(x,W):
    #x input tensor of shape '[batch,in_height,in_width,in_channles]'
    #W filter / kernel tensor of shape [filter_height,filter_width,in_channels,out_channels]
    #`strides[0] = strides[3] = 1`. strides[1]代表x方向的步长,strides[2]代表y方向的步长
    #padding: A `string` from: `"SAME", "VALID"`
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')#2d的意思是二维的卷积操作


#池化层
def max_pool_2x2(x):
    #ksize [1,x,y,1]  ksize 2*2为窗口大小, strides 步长,分别为横向与纵向
    return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')


#定义两个placeholder
x = tf.placeholder(tf.float32,[None,784])#28*28
y = tf.placeholder(tf.float32,[None,10])


#改变x的格式转为4D的向量[batch, in_height, in_width, in_channels]`
x_image = tf.reshape(x,[-1,28,28,1])  #因为池化是对图片进行操做,故将矩阵转化为二维图片
                            # 28*28表示原来图片大小,1表示图片是一维的,如果是彩色的就是3


#初始化第一个卷积层的权值和偏置
W_conv1 = weight_variable([5,5,1,32])#5*5的采样窗口,32个卷积核从1个平面抽取特征
b_conv1 = bias_variable([32])#每一个卷积核一个偏置值


#把x_image和权值向量进行卷积,再加上偏置值,然后应用于relu激活函数
h_conv1 = tf.nn.relu(conv2d(x_image,W_conv1)+b_conv1)     #得到第一次卷积后的结果
h_pool1 = max_pool_2x2(h_conv1)#进行max-pooling


#初始化第二个卷积层的权值和偏置
W_conv2 = weight_variable([5,5,32,64])#5*5的采样窗口,64个卷积核从32个平面抽取特征
b_conv2 = bias_variable([64])#每一个卷积核一个偏置值


#把h_pool1和权值向量进行卷积,再加上偏置值,然后应用于relu激活函数
h_conv2 = tf.nn.relu(conv2d(h_pool1,W_conv2) + b_conv2)
h_pool2 = max_pool_2x2(h_conv2)#进行max-pooling


#28*28的图片第一次卷积后还是28*28(数组变小了,但是图像大小不变),第一次池化后变为14*14
#第二次卷积后为14*14(卷积不会改变平面的大小),第二次池化后变为了7*7
#进过上面操作后得到64张7*7的平面


#初始化第一个全连接层的权值
W_fc1 = weight_variable([7*7*64,1024])#上一层有7*7*64个神经元,全连接层有1024个神经元
b_fc1 = bias_variable([1024])#1024个节点


#把池化层2的输出扁平化为1维
h_pool2_flat = tf.reshape(h_pool2,[-1,7*7*64])
#求第一个全连接层的输出
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat,W_fc1) + b_fc1)


#keep_prob用来表示神经元的输出概率
keep_prob = tf.placeholder(tf.float32)
h_fc1_drop = tf.nn.dropout(h_fc1,keep_prob)


#初始化第二个全连接层
W_fc2 = weight_variable([1024,10])
b_fc2 = bias_variable([10])


#计算输出
prediction = tf.nn.softmax(tf.matmul(h_fc1_drop,W_fc2) + b_fc2)


#交叉熵代价函数
cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y,logits=prediction))


#使用AdamOptimizer进行优化
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)


#结果存放在一个布尔列表中
correct_prediction = tf.equal(tf.argmax(prediction,1),tf.argmax(y,1))#argmax返回一维张量中最大的值所在的位置


#求准确率
accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))


with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for epoch in range(21):
        for batch in range(n_batch):
            batch_xs,batch_ys =  mnist.train.next_batch(batch_size)
            sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys,keep_prob:0.7})


        acc=sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels,keep_prob:1.0})
        print("Iter "+str(epoch)+", Testing Accuracy= "+str(acc))



几个疑问

1、卷积的输入为什么都是四维的?

要知道向量是干什么的

tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')

x = tf.placeholder(tf.float32,[None,784])   #784=28*28,表示每一个图片的像素点

x_image = tf.reshape(x,[-1,28,28,1])  #因为池化是对图片进行操做,故将矩阵转化为二维图片

W_conv1 = weight_variable([5,5,1,32])#5*5的采样窗口,32个卷积核从1个平面抽取特征

h_conv1 = tf.nn.relu(conv2d(x_image,W_conv1)+b_conv1)     #得到第一次卷积后的结果




ksize [1,x,y,1]  ksize 2*2为窗口大小, strides 步长,分别为横向与纵向
tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')


整个过程进行两次卷积与池化操作,得到结果h_pool2



2、模型创建,卷积过程每一步的解读

如创建如下模型:

输入数据:(batch_size,IMG_W,IMG_H,col_channel)= (20,  64,  64,  3)


卷积层1: (conv_kernel,num_channel,num_out_neure)= (3,  3,  3,  64)


池化层1: (ksize,strides,padding)= ([1,3,3,1], [1,2,2,1], 'SAME')


卷积层2: (conv_kernel,num_channel,num_out_neure)= (3,  3,  64,  16)


池化层2: (ksize,strides,padding)= ([1,3,3,1], [1,1,1,1], 'SAME')


全连接1: (out_pool2_reshape,num_out_neure)= (dim, 128)


全连接2: (fc1_out,num_out_neure)= (128,128)


softmax层: (fc2_out,num_classes) = (128,  4)


激活函数: tf.nn.relu


损失函数: tf.nn.sparse_softmax_cross_entropy_with_logits




2、全连接层的权值是怎么得到的W_fc1 = weight_variable([7*7*64,1024])

参考:点击打开链接



3、全连接之后进行dropout的作用,防止过拟合,用法如下

点击打开链接


4、softmax层作用:主要用于概率分类,参考softmax函数

softmax函数


总结:

卷积神经网络前面卷积的作用可以认为图像中的信息已经被抽象成了信息含量更高的特征,我们可以将卷积层与池化层看成自动图像特征提取的过程。

全连接的作用是,在图像提取完成之后,仍然需要使用全连接层来完成分类任务

卷积神经网络与全连接神经网络的区别及优势:卷积神经网络是根据人的视觉特性,认为视觉都是从局部到全局认知的,因此不全部采用全连接(一般只有1-2个全连接层,甚至最近的研究建议取消CNN的全连接层),而是采用一个滑动窗口只处理一个局部,这种操作像一个滤波器,这个操作称为卷积操作(不是信号处理那个卷积操作,当然卷积也可以),这种网络就称为卷积神经网络。  参考:前馈神经网络、BP网络、卷积神经网络区别联系



































猜你喜欢

转载自blog.csdn.net/qiurisiyu2016/article/details/80444151