目录
一、四种常见的二分查找变形问题
1.查找第一个值等于给定值的元素
2.查找最后一个值等于给定值的元素
3.查找第一个大于等于给定值的元素
4.查找最后一个小于等于给定值的元素
二、代码实现
前提假设:以数据是从小到大排列为前提来实现
1.查找第一个值等于给定值的元素,比如在数组a[10]={1,3,4,5,6,8,8,8,11,18}
public int bSear1(int[] a, int val){
int start = 0;
int end = a.length - 1;
int mid = -1;
while(start <= end){
mid = start + (end - start) / 2;
if (a[mid] > val) {
end = mid - 1;
} else if (a[mid] < val) {
start = mid + 1;
} else {
if(mid == 0 || a[mid-1] < val) break;
else end = mid - 1;
}
}
return mid;
}
2.查找最后一个值等于给定值的元素,比如在数组a[10]={1,3,4,5,6,8,8,8,11,18}
public int bSear2(int[] a, int val){
int start = 0;
int end = a.length - 1;
int mid = -1;
while(start <= end){
mid = start + (end - start) / 2;
if (a[mid] > val) {
end = mid - 1;
} else if (a[mid] < val) {
start = mid + 1;
} else {
if(mid == 0 || a[mid-1] < val) break;
else end = mid - 1;
}
}
return mid;
}
3.查找第一个大于等于给定值的元素,比如在数组a[10]={1,3,4,5,6,8,8,8,11,18}
public int bSear3(int[] a, int val){
int start = 0;
int end = a.length - 1;
int mid = -1;
while(start <= end){
mid = start + (end - start) / 2;
if(a[mid] > val){
if(start == end) break;
end = mid - 1;
} else if (a[mid] < val) {
start = start + 1;
if(mid == a.length-1) return -1;
} else {
if(mid == 0 || a[mid-1] < val)break; else end = mid - 1;
}
}
return mid;
}
4.查找最后一个小于等于给定值的元素,比如在数组a[10]={1,3,4,5,6,8,8,8,11,18}
public int bSear4(int[] a, int val){
int start = 0;
int end = a.length - 1;
int mid = -1;
while(start <= end){
mid = start + (end - start) / 2;
if(a[mid] > val){
end = mid - 1;
if(mid == 0) return -1;
} else if (a[mid] < val) {
if(start == end) {
break;
}
start = mid + 1;
} else {
if(mid == a.length-1 || a[mid+1] > val) break;
else start = mid + 1;
}
}
return mid;
}
三、适用性分析
1.凡事能用二分查找解决的,绝大部分我们更倾向于用散列表或者二叉查找树,即便二分查找在内存上更节省,但是毕竟内存如此紧缺的情况并不多。
2.求“值等于给定值”的二分查找确实不怎么用到,二分查找更适合用在”近似“查找问题上。比如上面讲几种变体。
四、思考
1.如何快速定位出一个IP地址的归属地?
[202.102.133.0, 202.102.133.255] 山东东营市
[202.102.135.0, 202.102.136.255] 山东烟台
[202.102.156.34, 202.102.157.255] 山东青岛
[202.102.48.0, 202.102.48.255] 江苏宿迁
[202.102.49.15, 202.102.51.251] 江苏泰州
[202.102.56.0, 202.102.56.255] 江苏连云港
假设我们有 12 万条这样的 IP 区间与归属地的对应关系,如何快速定位出一个IP地址的归属地呢?
2.如果有一个有序循环数组,比如4,5,6,1,2,3。针对这种情况,如何实现一个求“值等于给定值”的二分查找算法?