题目描述
给定一个长度为n的整数数列,以及一个整数k,请用快速选择算法求出数列从小到大排序后的第k个数。
输入格式
第一行包含两个整数 n 和 k。
第二行包含 n 个整数(所有整数均在1~109范围内),表示整数数列。
输出格式
输出一个整数,表示数列的第k小数。
数据范围
1 ≤ n ≤ 100000 1≤n≤100000 1≤n≤100000,
1 ≤ k ≤ n 1≤k≤n 1≤k≤n
输入样例:
5 3
2 4 1 5 3
输出样例:
3
算法思想
基于快排的思想,从数组a[]
中找出一个基准值v
,把数组分为两部分a[l...j]
和a[j+1...r]
。a[l...j]
中的元素小于v
,a[j+1...r]
中元素大于v
。这时有两种情况:
a[l...j]
中元素的个数大于等于k
,则递归到数组a[l...j]
中搜索的第k
小的数。a[l...j]
中元素的个数小于k
,则递归到数组a[j+1...r]
中第k-(j-l+1)
小的数
时间复杂度
因为每次分区完只需要继续操作一边,所以该算法的平均时间复杂度是 O ( n ) O(n) O(n)。
用 T ( n ) T(n) T(n)表示元素的比较次数,那么平均情况下:
- 第一次划分: T ( n ) = T ( n 2 ) + n T(n) = T(\frac{n}{2}) + n T(n)=T(2n)+n
- 第二次划分: T ( n ) = T ( n 4 ) + n 2 + n T(n) = T(\frac{n}{4}) + \frac{n}{2} + n T(n)=T(4n)+2n+n
- 第三次划分: T ( n ) = T ( n 8 ) + n 4 + n 2 + n T(n) = T(\frac{n}{8}) + \frac{n}{4}+\frac{n}{2} + n T(n)=T(8n)+4n+2n+n
- . . . ... ...
- 最终: T ( n ) = T ( n n ) + 2 + 4 + . . . + n 4 + n 2 + n = 1 + 2 + 4 + . . . + n T(n) = T(\frac{n}{n}) + 2 + 4 +...+ \frac{n}{4}+\frac{n}{2} + n = 1 + 2 + 4 + ... + n T(n)=T(nn)+2+4+...+4n+2n+n=1+2+4+...+n
是一个等比数列的求和公式,公比为2,一共有 l o g 2 n log_2^n log2n,最终结果为: T ( n ) = 1 − 2 × n 1 − 2 ≈ 2 n T(n) = \frac{1-2 \times n}{1-2}≈2n T(n)=1−21−2×n≈2n。
代码实现
#include <iostream>
using namespace std;
const int N = 100010;
int a[N];
int find(int l, int r, int k)
{
if(l >= r) return a[l];
int i = l - 1, j = r + 1, v = a[l + r >> 1];
while(i < j)
{
do i ++; while(a[i] < v);
do j --; while(a[j] > v);
if(i < j) swap(a[i], a[j]);
}
if(j - l + 1 >= k) return find(l, j, k);
else return find(j + 1, r, k - (j - l + 1));
}
int main()
{
int n, k;
cin >> n >> k;
for(int i = 0; i < n; i ++) cin >> a[i];
cout << find(0, n - 1, k) << endl;
return 0;
}