原文链接:
https://www.jianshu.com/p/30b40b504bae
https://blog.csdn.net/u012193416/article/details/83349138
tf.reduce_sum()说明
reduce_sum() 用于计算张量tensor沿着某一维度的和,可以在求和后降维。
tf.reduce_sum(
input_tensor,
axis=None,
keepdims=None,
name=None,
reduction_indices=None,
keep_dims=None)
input_tensor:待求和的tensor;
axis:指定的维,如果不指定,则计算所有元素的总和;
keepdims:是否保持原有张量的维度,设置为True,结果保持输入tensor的形状,设置为False,结果会降低维度,如果不传入这个参数,则系统默认为False;
name:操作的名称;
reduction_indices:在以前版本中用来指定轴,已弃用;
keep_dims:在以前版本中用来设置是否保持原张量的维度,已弃用;
什么是维度?什么是轴(axis)?
维度是用来索引一个多维数组中某个具体数所需要最少的坐标数量。
- 0维,又称0维张量,数字,标量:1
- 1维,又称1维张量,数组,vector:[1, 2, 3]
- 2维,又称2维张量,矩阵,二维数组:[[1,2], [3,4]]
- 3维,又称3维张量,立方(cube),三维数组:[ [[1,2], [3,4]], [[5,6], [7,8]] ]
- n维:你应该get到点了吧~
再多的维只不过是是把上一个维度当作自己的元素
1维的元素是标量,2维的元素是数组,3维的元素是矩阵。
在纸上写写看,想要精确定位一个数字,需要几个数字呢?比如上面例子中的3维数组,我们想要3这个数字,至少要3个数字定位,它的坐标是(0为索引起点):[0, 1, 0]
axis是多维数组每个维度的坐标
还拿3维来说,数字3的坐标是[0, 1, 0],那么第一个数字0的axis是0,第二个数字1的axis是1,第三个数字0的axis是2。
让我们再看看我们是如何得到3这个数字的:
- 找到3所在的2维矩阵在这个3维立方的索引:0
- 找到3所在的1维数组在这个2维矩阵的索引:1
- 找到3这个数这个1维数组的索引:0
也就是说,对于[ [[1,2], [3,4]], [[5,6], [7,8]] ]这个3维情况,[[1,2],[3,4]], [[5,6], [7,8]]这两个矩阵(还记得吗,高维的元素低一个维度,因此三维立方的元素是二维矩阵)的axis是0,[1,2],[3,4],[5,6],[7,8]这4个数组(二维矩阵的元素是一维数组)的axis是1,而1,2,3,4,5,6,7,8这8个数的axis是2。
越往里axis就越大,依次加1
这里需要注意的是,axis可以为负数,此时表示倒数第axis个维度,这和Python中列表切片的用法类似。
下面举个多维tensor例子简单说明。下面是个 2 * 3 * 4 的tensor。
[[[ 1 2 3 4]
[ 5 6 7 8]
[ 9 10 11 12]],
[[ 13 14 15 16]
[ 17 18 19 20]
[ 21 22 23 24]]]
tf.reduce_sum(tensor, axis=None) 使用默认值axis=None则将纬度降为1及求和所有值
1+2+3+4+
5+6+7+8+
9+10+11+12+
13+14+15+16+
17+18+19+20+
21+22+23+34
tf.reduce_sum(tensor, axis=0) axis=0 说明是按第一个维度进行求和。那么求和结果shape是3*4
[[1+13 2+14 3+15 4+16]
[5+17 6+18 7+19 8+20]
[9+21 10+22 11+23 12+24]]
依次类推,如果axis=1,那么求和结果shape是2*4,即:
[[ 1 + 5 + 9 2 + 6+10 3 + 7+11 4 + 8+12]
[13+17+21 14+18+22 15+19+23 16+20+24]]
如果axis=2,那么求和结果shape是2*3,即:
[[1+2+3+4 5+6+7+8 9+10+11+12]
[13+14+15+16 17+18+19+20 1+22+23+24]]
类似的方法还有:
- tf.reduce_mean():计算tensor指定轴方向上的所有元素的累加和;
- tf.reduce_max():计算tensor指定轴方向上的各个元素的最大值;
- tf.reduce_all():计算tensor指定轴方向上的各个元素的逻辑和(and运算);
- tf.reduce_any():计算tensor指定轴方向上的各个元素的逻辑或(or运算);
代码
import tensorflow as tf
tensor = tf.constant([[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]],
[[13, 14, 15, 16], [17, 18, 19, 20], [21, 22, 23, 24]]])
axis_none = tf.reduce_sum(tensor, axis=None)
axis_0 = tf.reduce_sum(tensor, axis=0)
axis_1 = tf.reduce_sum(tensor, axis=1)
axis_2 = tf.reduce_sum(tensor, axis=2)
with tf.Session() as sess:
print("tensor:")
print(sess.run(tensor))
print("tensor.shape:")
print(tensor.shape)
print("--------------")
print("axis_none:")
print(sess.run(axis_none))
print("axis_none.shape:")
print(axis_none.shape)
print("--------------")
print("axis_0:")
print(sess.run(axis_0))
print("axis_0.shape:")
print(axis_0.shape)
print("--------------")
print("axis_1:")
print(sess.run(axis_1))
print("axis_1.shape:")
print(axis_1.shape)
print("--------------")
print("axis_2:")
print(sess.run(axis_2))
print("axis_2.shape:")
print(axis_2.shape)
结果输出
tensor:
[[[ 1 2 3 4]
[ 5 6 7 8]
[ 9 10 11 12]]
[[13 14 15 16]
[17 18 19 20]
[21 22 23 24]]]
tensor.shape:
(2, 3, 4)
--------------
axis_none:
300
axis_none.shape:
()
--------------
axis_0:
[[14 16 18 20]
[22 24 26 28]
[30 32 34 36]]
axis_0.shape:
(3, 4)
--------------
axis_1:
[[15 18 21 24]
[51 54 57 60]]
axis_1.shape:
(2, 4)
--------------
axis_2:
[[10 26 42]
[58 74 90]]
axis_2.shape:
(2, 3)