线段树之空间优化

一般来说，传统的线段树结点都是这样定义的：

struct Node {
    int left, right;
    int w;
    int f;
}tree[4*manx];

对于跨度为 n 的数据我们需要开 4 倍的空间，这样才能保证不会出现越界的情况。

在这样的定义中，左孩子的坐标是 2*k，右孩子的坐标是 2*k+1，叶子结点的坐标有可能超过 2n 但不会超过 4n，因此需要开 4 倍的空间。

但是开了这么多的空间中仅仅只有 2n-1 个结点是真正被使用的，其他的结点都被填空，造成了很多的空间浪费。

怎么进行优化呢？还记得之前讲过的 dfs 序吗，这里又派上用场了。

使用 dfs 序能够将所有结点按照深度优先遍历的顺序排列成一个线性的数组，这样我们就可以只使用 2n-1 的空间而不是 4n 了，一下子降低了一半！

图片引用自 http://www.cppblog.com/MatoNo1/archive/2015/05/05/195857.html

比如上面这颗线段树，表示的跨度为 [0, 5]，长度为 6 的区间，一般我们需要开 24 的空间大小，现在使用 dfs 序优化。

dfs 遍历时各个结点的顺序如上图所示，我们使用长度为 11 或 12(不使用0元素) 的数组来保存：

1 2 3 4 5 6

[0, 5] [0, 2] [0, 1] [0, 0] [1, 1] [2, 2]

7 8 9 10 11

[3, 5] [3, 4] [3, 3] [4, 4] [5, 5]

我们可以发现在这种存储方式下，每个结点的左孩子从 2*k 变成 k+1，右孩子不再是 2*k+1，并且变成不那么容易确定，通过观察可以找到一些规律，右孩子总是要在左孩子全部遍历完才可以被访问，因此右孩子的坐标为 k+1+sizeof(左孩子)。

那么 sizeof(左孩子) 要怎么确定呢？

已知跨度为 n 的二叉树的结点总数为 2n-1，而左孩子的跨度为 mid-left+1，即 (left+right)/2-left+1，因此左孩子的节点总数为 2*((left+right)/2-left+1)-1 = right-left+1。

这个结论是有问题的，因为没有考虑到 (left+right)/2 是整除，正确的结论如下：

若 right-left 是偶数，sizeof(左孩子) = right-left+1; (故右孩子为 k+right-left+2)

若 right-left 是奇数，sizeof(左孩子) = right-left; (故右孩子为 k+right-left+1)

这样我们在访问左右孩子的时候可以这样写：

int mid = (left+right)/2;
update(k+1, left, mid);
update((right-left)%2==1?k+right-left+1:k+right-left+2, mid+1, right);

当然，节省了空间往往意味着将会消耗更多的时间，相比于传统的 4n 空间的线段树，dfs 序优化的线段树的效率大概降低了 10%~15% 左右，且进行 down 下传的时候变成不容易操作，酌情使用！

【END】感谢观看！

发布了44 篇原创文章 · 获赞 17 · 访问量 9102

私信关注