完整神经网络样例程序

1.训练神经网络解决二分类问题

import tensorflow as tf

#numpy是一个科学计算的工具包，这里通过Numpy工具包生成模拟数据集
from numpy.random import RandomState

#定义训练数据batch的大小
batch_size = 8

#定义神经网络的参数
w1 = tf.Variable(tf.random_normal([2,3], stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal([3,1], stddev=1, seed=1))
#tf.random_normal([2,3], stddev=2)会产生一个2x3矩阵，矩阵中的元素是均值为0、标准差为1的随机数。

#在shape的一个维度上使用None可以方便使用不同batch大小。
#在训练时需要把数据分成比较小的batch，但是在测试时，可以一次性使用全部的数据。
#当数据集比较小时这样比较方便测试，但数据集比较大时，将大量数据放入一个batch可能会导致内存溢出
x = tf.placeholder(tf.float32, shape=(None, 2), name='x_input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y_input')

#定义神经网络前向传播的过程
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

#定义损失函数和反向传播的算法
cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)))
train_step = tf.train.AdagradOptimizer(0.001).minimize(cross_entropy)

#通过随机数产生一个模拟数据集
rdm = RandomState(1)
dataset_size = 128
X = rdm.rand(dataset_size, 2)
#定义规则来给出样本的标签。在这里x1+x2<1的样例都被认为是正样本（比如零件合格），而其他为负样本（比如零件不合格）
#在这里使用0表示负样本，1表示正样本。大部分分类问题的神经网络都会采用0和1的表示方法。
Y = [[int(x1+x2<1)] for (x1, x2) in X]

#创建一个会话来运行tensorflow程序
with tf.Session() as sess:
       init_op = tf.initialize_all_variables()
       #初始化变量
       sess.run(init_op)
       print (sess.run(w1))
       print (sess.run(w2))

       #设定训练的轮数
       STEPS = 5000
       for i in range(STEPS):
              #每次选取batch_size个样本进行训练
              start = (i * batch_size) % dataset_size
              end = min(start+batch_size, dataset_size)

              #通过选取的样本训练神经网络并更新参数
              sess.run(train_step, feed_dict={x: X[start:end], y_:Y[start:end]})
              if i % 1000 == 0:
                     #每隔一段时间计算所有数据上的交叉shuang并输出
                     total_cross_entropy = sess.run(cross_entropy, feed_dict={x:X, y_:Y})
                     print ("After %d training steps, cross entropy on all data is %g"%(i,total_cross_entropy))


       print (sess.run(w1))
       print (sess.run(w2))

2.训练神经网络的过程总结
从上面的程序可以总结出训练神经网络的过程可以分为以下3个步骤：

1.定义神经网络的结构和前向传播的的输出结果。
2.定义损失函数以及选择反向传播优化的算法。
3.生成会话(tf.Session)并且在训练数据上反复运行反向传播优化算法。

无论神经网络的结构如何变化，这3个步骤是不变的。

完整神经网络样例程序

猜你喜欢