原文链接：
https://www.jianshu.com/p/30b40b504bae
https://blog.csdn.net/u012193416/article/details/83349138

tf.reduce_sum()说明

reduce_sum() 用于计算张量tensor沿着某一维度的和，可以在求和后降维。

tf.reduce_sum(
    input_tensor, 
    axis=None, 
    keepdims=None,
    name=None,
    reduction_indices=None, 
    keep_dims=None)

input_tensor：待求和的tensor;
axis：指定的维，如果不指定，则计算所有元素的总和;
keepdims：是否保持原有张量的维度，设置为True，结果保持输入tensor的形状，设置为False，结果会降低维度，如果不传入这个参数，则系统默认为False;
name：操作的名称;
reduction_indices：在以前版本中用来指定轴，已弃用;
keep_dims：在以前版本中用来设置是否保持原张量的维度，已弃用;

什么是维度？什么是轴（axis）？

维度是用来索引一个多维数组中某个具体数所需要最少的坐标数量。

0维，又称0维张量，数字，标量：1
1维，又称1维张量，数组，vector：[1, 2, 3]
2维，又称2维张量，矩阵，二维数组：[[1,2], [3,4]]
3维，又称3维张量，立方（cube），三维数组：[ [[1,2], [3,4]], [[5,6], [7,8]] ]
n维：你应该get到点了吧~

再多的维只不过是是把上一个维度当作自己的元素
1维的元素是标量，2维的元素是数组，3维的元素是矩阵。
在纸上写写看，想要精确定位一个数字，需要几个数字呢？比如上面例子中的3维数组，我们想要3这个数字，至少要3个数字定位，它的坐标是（0为索引起点）：[0, 1, 0]

axis是多维数组每个维度的坐标
还拿3维来说，数字3的坐标是[0, 1, 0]，那么第一个数字0的axis是0，第二个数字1的axis是1，第三个数字0的axis是2。

让我们再看看我们是如何得到3这个数字的：

找到3所在的2维矩阵在这个3维立方的索引：0
找到3所在的1维数组在这个2维矩阵的索引：1
找到3这个数这个1维数组的索引：0

也就是说，对于[ [[1,2], [3,4]], [[5,6], [7,8]] ]这个3维情况，[[1,2],[3,4]], [[5,6], [7,8]]这两个矩阵（还记得吗，高维的元素低一个维度，因此三维立方的元素是二维矩阵）的axis是0，[1,2]，[3,4]，[5,6]，[7,8]这4个数组（二维矩阵的元素是一维数组）的axis是1，而1，2，3，4，5，6，7，8这8个数的axis是2。

越往里axis就越大，依次加1
这里需要注意的是，axis可以为负数，此时表示倒数第axis个维度，这和Python中列表切片的用法类似。

下面举个多维tensor例子简单说明。下面是个 2 * 3 * 4 的tensor。

[[[ 1   2   3   4]
  [ 5   6   7   8]
  [ 9   10 11 12]],
 [[ 13  14 15 16]
  [ 17  18 19 20]
  [ 21  22 23 24]]]

tf.reduce_sum(tensor, axis=None) 使用默认值axis=None则将纬度降为1及求和所有值

1+2+3+4+
5+6+7+8+
9+10+11+12+
13+14+15+16+
17+18+19+20+
21+22+23+34

tf.reduce_sum(tensor, axis=0) axis=0 说明是按第一个维度进行求和。那么求和结果shape是3*4

[[1+13   2+14   3+15 4+16]
 [5+17   6+18   7+19 8+20]
 [9+21 10+22 11+23 12+24]]

依次类推，如果axis=1，那么求和结果shape是2*4，即：

[[ 1 + 5 + 9   2 + 6+10   3 + 7+11   4 + 8+12]
 [13+17+21     14+18+22   15+19+23   16+20+24]]

如果axis=2，那么求和结果shape是2*3，即：

[[1+2+3+4          5+6+7+8          9+10+11+12]
 [13+14+15+16      17+18+19+20      1+22+23+24]]

类似的方法还有：

tf.reduce_mean()：计算tensor指定轴方向上的所有元素的累加和；
tf.reduce_max()：计算tensor指定轴方向上的各个元素的最大值；
tf.reduce_all()：计算tensor指定轴方向上的各个元素的逻辑和（and运算）；
tf.reduce_any()：计算tensor指定轴方向上的各个元素的逻辑或（or运算）；

代码

import tensorflow as tf

tensor = tf.constant([[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]],
        [[13, 14, 15, 16], [17, 18, 19, 20], [21, 22, 23, 24]]])

axis_none = tf.reduce_sum(tensor, axis=None)
axis_0 = tf.reduce_sum(tensor, axis=0)
axis_1 = tf.reduce_sum(tensor, axis=1)
axis_2 = tf.reduce_sum(tensor, axis=2)

with tf.Session() as sess:
    print("tensor:")
    print(sess.run(tensor))
    print("tensor.shape:")
    print(tensor.shape)
    print("--------------")
    print("axis_none:")
    print(sess.run(axis_none))
    print("axis_none.shape:")
    print(axis_none.shape)
    print("--------------")
    print("axis_0:")
    print(sess.run(axis_0))
    print("axis_0.shape:")
    print(axis_0.shape)
    print("--------------")
    print("axis_1:")
    print(sess.run(axis_1))
    print("axis_1.shape:")
    print(axis_1.shape)
    print("--------------")
    print("axis_2:")
    print(sess.run(axis_2))
    print("axis_2.shape:")
    print(axis_2.shape)

结果输出

tensor:
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]]
tensor.shape:
(2, 3, 4)
--------------
axis_none:
300
axis_none.shape:
()
--------------
axis_0:
[[14 16 18 20]
 [22 24 26 28]
 [30 32 34 36]]
axis_0.shape:
(3, 4)
--------------
axis_1:
[[15 18 21 24]
 [51 54 57 60]]
axis_1.shape:
(2, 4)
--------------
axis_2:
[[10 26 42]
 [58 74 90]]
axis_2.shape:
(2, 3)

取名为猫的狗

发布了90 篇原创文章 · 获赞 9 · 访问量 3万+

私信关注

Tensorflow tf.reduce_sum()

tf.reduce_sum()说明

什么是维度？什么是轴（axis）？

代码

猜你喜欢