线段树之空间优化
一般来说,传统的线段树结点都是这样定义的:
struct Node {
int left, right;
int w;
int f;
}tree[4*manx];
对于跨度为 n 的数据我们需要开 4 倍的空间,这样才能保证不会出现越界的情况。
在这样的定义中,左孩子的坐标是 2*k,右孩子的坐标是 2*k+1,叶子结点的坐标有可能超过 2n 但不会超过 4n,因此需要开 4 倍的空间。
但是开了这么多的空间中仅仅只有 2n-1 个结点是真正被使用的,其他的结点都被填空,造成了很多的空间浪费。
怎么进行优化呢?还记得之前讲过的 dfs 序吗,这里又派上用场了。
使用 dfs 序能够将所有结点按照深度优先遍历的顺序排列成一个线性的数组,这样我们就可以只使用 2n-1 的空间而不是 4n 了,一下子降低了一半!
图片引用自 http://www.cppblog.com/MatoNo1/archive/2015/05/05/195857.html
比如上面这颗线段树,表示的跨度为 [0, 5],长度为 6 的区间,一般我们需要开 24 的空间大小,现在使用 dfs 序优化。
dfs 遍历时各个结点的顺序如上图所示,我们使用长度为 11 或 12(不使用0元素) 的数组来保存:
1 2 3 4 5 6
[0, 5] [0, 2] [0, 1] [0, 0] [1, 1] [2, 2]
7 8 9 10 11
[3, 5] [3, 4] [3, 3] [4, 4] [5, 5]
我们可以发现在这种存储方式下,每个结点的左孩子从 2*k 变成 k+1,右孩子不再是 2*k+1,并且变成不那么容易确定,通过观察可以找到一些规律,右孩子总是要在左孩子全部遍历完才可以被访问,因此右孩子的坐标为 k+1+sizeof(左孩子)。
那么 sizeof(左孩子) 要怎么确定呢?
已知跨度为 n 的二叉树的结点总数为 2n-1,而左孩子的跨度为 mid-left+1,即 (left+right)/2-left+1,因此左孩子的节点总数为 2*((left+right)/2-left+1)-1 = right-left+1。
这个结论是有问题的,因为没有考虑到 (left+right)/2 是整除,正确的结论如下:
若 right-left 是偶数,sizeof(左孩子) = right-left+1; (故右孩子为 k+right-left+2)
若 right-left 是奇数,sizeof(左孩子) = right-left; (故右孩子为 k+right-left+1)
这样我们在访问左右孩子的时候可以这样写:
int mid = (left+right)/2;
update(k+1, left, mid);
update((right-left)%2==1?k+right-left+1:k+right-left+2, mid+1, right);
当然,节省了空间往往意味着将会消耗更多的时间,相比于传统的 4n 空间的线段树,dfs 序优化的线段树的效率大概降低了 10%~15% 左右,且进行 down 下传的时候变成不容易操作,酌情使用!
【END】感谢观看!