演示梯度停止实现

一 实例描述
在反向传播过程中某种特殊情况需要停止梯度的运算时,在TensorFlow中提供了一个tf.stop_gradient函数,被它定义过的节点将没有梯度运算功能。
二 代码
import tensorflow as tf
tf.reset_default_graph()
w1 = tf.get_variable('w1', shape=[2])
w2 = tf.get_variable('w2', shape=[2])
w3 = tf.get_variable('w3', shape=[2])
w4 = tf.get_variable('w4', shape=[2])
y1 = w1 + w2+ w3
y2 = w3 + w4
a = w1+w2
a_stoped = tf.stop_gradient(a)
y3= a_stoped+w3
gradients = tf.gradients([y1, y2], [w1, w2, w3, w4], grad_ys=[tf.convert_to_tensor([1.,2.]),
                                                          tf.convert_to_tensor([3.,4.])])
                                                          
gradients2 = tf.gradients(y3, [w1, w2, w3], grad_ys=tf.convert_to_tensor([1.,2.]))                                                          
print(gradients2)
gradients3 = tf.gradients(y3, [ w3], grad_ys=tf.convert_to_tensor([1.,2.]))
                                                       
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    print(sess.run(gradients))
    #print(sess.run(gradients2))#报错
    print(sess.run(gradients3))
三 运行结果
[array([ 1.,  2.], dtype=float32), array([ 1.,  2.], dtype=float32), array([ 4.,  6.], dtype=float32), array([ 3.,  4.], dtype=float32)]
[array([ 1.,  2.], dtype=float32)]
四 参考

猜你喜欢

转载自blog.csdn.net/chengqiuming/article/details/80329597