RMQ算法详解

版权声明:转载请标明出处 https://blog.csdn.net/weixin_41190227/article/details/86564626

RMQ(Range Minimum/Maximum Query),即区间最值查询,这是一种在线算法,所谓在线算法,是指用户每次输入一个查询,便马上处理一个查询。RMQ算法一般用较长时间做预处理,时间复杂度为O(nlogn),然后可以在O(1)的时间内处理每次查询。

下面我们从一个实际问题来解释RMQ

我们假设数组arr为:1,3,6,7,4,2,5

我们设二维数组dp[i][j]表示从第i位开始连续2^j个数中的最小值。例如dp[2][1]就表示从第二位数开始连续两个数的最小值(也就是从第二位数到第三位数的最小值),即3,6中的最小值,所以dp[2][1] = 3;

其实我们求 dp[i][j] 的时候可以把它分成两部分,第一部分是从 i 到 i + 2 ^( j-1 ) - 1 ,第二部分从 i + 2 ^( j-1 ) 到i + 2^j -1 ,为什么可以这么分呢?其实我们都知道二进制数前一个数是后一个的两倍,那么可以把 i ~ i + 2^j -1 这个区间 通过2^(j-1) 分成相等的两部分, 那么转移方程很容易就写出来了。(dp[i][0]就表示本身)

dp[i][j] = min(dp [i][j - 1], dp [i + (1 << j - 1)][j - 1])

void rmqInit(){
    for  (int i = 1; i <= n; i++) dp[i][0] = height[i] ;
    int m=(int)(log(n*1.0)/log(2.0));
    for (int j = 1; j <= m; j++){
        for (int i = 1; i + (1 << j) - 1 <= n; i++){
            dp[i][j] = min(dp[i][j - 1], dp[i + (1 << j - 1)][j - 1]) ;
        }
    }
}

这里需要注意一个循环变量的顺序,我们看到外层循环变量为j,内层循环变量为i,这是为什么呢?可以互换一下位置吗?

答案当然是不可以,我们要理解这个状态转移方程的意义,这个状态方程的含义是:先更新每两个元素中的最小值,然后通过每两个元素的最小值获得每4个元素中的最小值,依次类推更新所有长度的最小值。

而如果是i在外,j在内的话,我们更新的顺序就变成了从1开始的前1个元素,前2个元素,前4个元素,前8个元素。。。

当j等于3的时候dp[1][3] = min(min(ans[0],ans[1],ans[2],ans[3]),min(ans[4],ans[5],ans[6],ans[7]))的值,

但是我们根本没有计算min(ans[0],ans[1],ans[2],ans[3])和min(ans[4],ans[5],ans[6],ans[7]),所以这样的方法肯定是错误的。

为了避免这样的错误,一定要好好理解这个状态转移方程所代表的含义。

接下来我们来讲解RMQ的查询部分,假设我们需要查询区间[l ,r]中的最小值,令k = log2(r - l + 1); 则区间[l, r]的最小值RMQ[l,r] = min(dp[l][k], dp[r - (1 << k) + 1][k]);

但是为什么这样就可以保证是区间最小值了呢?

mn[l][k]维护的是[l, l + 2 ^ k - 1], mn[r - (1 << k) + 1][k]维护的是[r - 2 ^ k + 1, r] 。

那么只要我们保证r - 2 ^ k + 1 <= l + 2 ^ k - 1就能保证RMQ[l,r] = min(dp[l][k], dp[r - (1 << k) + 1][k]);


 

接下来我们用分析法来证明这个不等式:

我们假设 r - 2^k +1 <= l + 2^k -1 这个等式成立

即有 r - l + 2 <= 2^(k+1) 也就是 r - l + 2 <= 2 * 2^k

又因为 k =log2 (r- l + 1);

那么 r - l + 2 <= 2 * (r - l +1)

则 r - l + 2 <= 2*(r - l) + 2

所以 r - l >= 0 所以假设成立

我们举个栗子 l = 4,r = 6;

我们假设数组arr为:1,3,6,7,4,2,5

此时 k = log2( r - l + 1)= log2(3)=1

则dp[4][6] = min(dp[4][1],dp[5][1])

dp[4][1] = 4,dp[5][1] = 2,所以dp[4][6] = min(dp[4][1],dp[5][1]) = 2

我们很容易看出来答案是正确的。

int getRmq(int x, int y){
    int l = Rank[x], r = Rank[y] ;
    if (l > r) swap(l ,r) ;
    l++ ;
    int k=int(log(r-l+1.0)/log(2.0));
	return min(dp[l][k],dp[r -(1 << k) + 1][k]);
}

猜你喜欢

转载自blog.csdn.net/weixin_41190227/article/details/86564626