TensorFlow实现VGGNet-16

VGGNet网络结构：

VGGNet-16由5段卷积和3层全连接组成，每段卷积内有2~3个卷积层，每段尾部连接一个最大池化层，因此有5个最大池化层。每段卷积核数量一样，越靠后的段卷积核数量越多，64->128->256->512->512。本文代码参考：https://github.com/machrisaa/tensorflow-vgg，论文参考：《Very Deep Convolutional Networks forLarge-Scale Image Recognition》。

VGGNet-16的代码：

#coding=utf-8

from datetime import datetime
import path
import time
import tensorflow as tf


batch_size=32
num_batches=100

# 定义一个卷积操作函数
def conv_op(input_op,name,kh,kw,n_out,dh,dw,p):
	n_in=input_op.get_shape()[-1].value
	with tf.name_scope(name) as scope:
		kernel=tf.get_variable(scope+'w',shape=[kh,kw,n_in,n_out],dtype=tf.float32,initializer=tf.contrib.layers.xavier_initializer_conv2d())
		conv=tf.nn.conv2d(input_op,kernel,(1,dh,dw,1),padding='SAME')
		bias_init_val=tf.constant(0.0,shape=[n_out],dtype=tf.float32)
		biases=tf.Variable(bias_init_val,trainable=True,name='b')
		z=tf.nn.bias_add(conv,biases)
		activation=tf.nn.relu(z,name=scope)
		p+=[kernel,biases]
		return activation


#定义一个全连接层的创建函数
def fc_op(input_op,name,n_out,p):
	n_in=input_op.get_shape()[-1].value
	with tf.name_scope(name) as scope:
		kernel=tf.get_variable(scope+'w',shape=[n_in,n_out],dtype=tf.float32,initializer=tf.contrib.layers.xavier_initializer_conv2d())
		biases=tf.Variable(tf.constant(0.1,shape=[n_out],dtype=tf.float32),name='b')
		activation=tf.nn.relu_layer(input_op,kernel,biases,name=scope)
		p+=[kernel,biases]
		return activation

#定义一个最大池化层函数
def mpool_op(input_op,name,kh,kw,dh,dw):
	return tf.nn.max_pool(input_op,ksize=[1,kh,kw,1],strides=[1,dh,dw,1],padding='SAME',name=name)

# 接下来定义VGG-16的网络框架,5段卷积 + 3层全连接
def inference_op(input_op,keep_prob):
	p=[]

	# 第一段卷积层
	conv1_1=conv_op(input_op,name='conv1_1',kh=3,kw=3,n_out=64,dh=1,dw=1,p=p)
	conv1_2=conv_op(conv1_1,name='conv1_2',kh=3,kw=3,n_out=64,dh=1,dw=1,p=p)
	pool1=mpool_op(conv1_2,name='pool1',kh=2,kw=2,dh=2,dw=2)

	# 第二段卷积层
	conv2_1=conv_op(pool1,name='conv2_1',kh=3,kw=3,n_out=128,dh=1,dw=1,p=p)
	conv2_2=conv_op(conv2_1,name='conv2_2',kh=3,kw=3,n_out=128,dh=1,dw=1,p=p)
	pool2=mpool_op(conv2_2,name='pool2',kh=2,kw=2,dh=2,dw=2)

	# 第三段卷积层
	conv3_1=conv_op(pool2,name='conv3_1',kh=3,kw=3,n_out=256,dh=1,dw=1,p=p)
	conv3_2=conv_op(conv3_1,name='conv3_2',kh=3,kw=3,n_out=256,dh=1,dw=1,p=p)
	conv3_3=conv_op(conv3_2,name='conv3_3',kh=3,kw=3,n_out=256,dh=1,dw=1,p=p)
	pool3=mpool_op(conv3_3,name='pool3',kh=2,kw=2,dh=2,dw=2)

	# 第四段卷积层
	conv4_1=conv_op(pool3,name='conv4_1',kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
	conv4_2=conv_op(conv4_1,name='conv4_2',kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
	conv4_3=conv_op(conv4_2,name='conv4_3',kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
	pool4=mpool_op(conv4_3,name='pool4',kh=2,kw=2,dh=2,dw=2)

	# 第五段卷积层
	conv5_1=conv_op(pool4,name='conv5_1',kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
	conv5_2=conv_op(conv5_1,name='conv5_2',kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
	conv5_3=conv_op(conv5_2,name='conv5_3',kh=3,kw=3,n_out=512,dh=1,dw=1,p=p)
	pool5=mpool_op(conv5_3,name='pool5',kh=2,kw=2,dh=2,dw=2)

	# 展开为一维向量
	shp=pool5.get_shape()
	flattened_shape=shp[1].value*shp[2].value*shp[3].value
	resh1=tf.reshape(pool5,[-1,flattened_shape],name='resh1')

	# 第一层全连接
	fc6=fc_op(resh1,name='fc6',n_out=4096,p=p)
	fc6_drop=tf.nn.dropout(fc6,keep_prob,name='fc6_drop')

	# 第二层全连接
	fc7=fc_op(fc6_drop,name='fc7',n_out=4096,p=p)
	fc7_drop=tf.nn.dropout(fc7,keep_prob,name='fc7_drop')

	# 第三层全连接
	fc8=fc_op(fc7_drop,name='fc8',n_out=1000,p=p)
	softmax=tf.nn.softmax(fc8)
	predictions=tf.argmax(softmax,1)
	return predictions,softmax,fc8,p

# 定义计算时间的函数
def time_tensorflow_run(session,target,feed,info_string):
	num_steps_burn_in=10      # 预热轮数，给程序热身
	total_duration=0.0
	total_duration_suqred=0.0

	for i in range(num_batches+num_steps_burn_in):
		start_time=time.time()
		_=session.run(target,feed_dict=feed)		
		duration=time.time()-start_time
		print ("step:",i,"time:",duration)
		if i >=num_steps_burn_in:
			if not i%10:
				print ('%s:step %d,duration=%.3f' %(datetime.now(),i - num_steps_burn_in,duration))
			total_duration+=duration
			total_duration_suqred+=duration*duration

			mn=total_duration/num_batches                  # 计算每轮的平均耗时
			vr=total_duration_suqred/num_batches - mn*mn   
			sd=math.sqrt(vr)                               # 计算标准差
			print ('%s:%s across %d steps,%.3f +/- %.3f sec/batch ' %(datetime.now(),info_string,num_batches,mn,sd))

# 定义主函数
def run_benchmark():
	with tf.Graph().as_default():
		image_size=224
		images=tf.Variable(tf.random_normal([batch_size,image_size,image_size,3],dtype=tf.float32,stddev=1e-1))
		keep_prob=tf.placeholder(tf.float32)
		predictions,softmax,fc8,p=inference_op(images,keep_prob)
		init=tf.global_variables_initializer()
		sess=tf.Session()
		sess.run(init)

		time_tensorflow_run(sess,predictions,{keep_prob:1.0},"Forward")
		objective=tf.nn.l2_loss(fc8)
		grad=tf.gradients(objective,p)
		time_tensorflow_run(sess,grad,{keep_prob:0.5},"Forward-backward")

if __name__ == '__main__':
	run_benchmark()

参考：《TensorFlow 实战》

TensorFlow实现VGGNet-16

猜你喜欢