数据结构(十)——查找算法

前言

上篇文章给大家介绍了排序算法，主要介绍了排序算法中的主要排序的方式以及十大排序算法的分类。另外还介绍了算法中常见的时间复杂度以及空间复杂度。本文给大家介绍查找的算法。主要将给大家介绍查找算法的整体介绍以及分别介绍数据结构中常用的几种查找算法，包括线性查找，也叫顺序查找；二分查找、插值查找以及斐波那契查找。首先给大家介绍在数据结构中常见的几种查找算法。

一、线性查找

在数据结构与算法中，我们一般查找的算法只要有：顺序查找(线性查找)、二分查找/折半查找、插值查找以及斐波那契查找。插值查找即就是给定一组数字，我们直接将给定的值找到，若找到则返回该值，没找到则返回-1。具体我们利用顺序查找将{1, 9, 11, -1, 34,89}，具体用java实现代码如下：

public class SeqSearch {
    
    
    public static void main(String[] args) {
    
    
        int arr[] = {
    
    1, 9, 11, -1, 34,89};
        int index = seqSearch(arr, -1);
        if (index == -1){
    
    
            System.out.println ("没有找到");
        }else {
    
    
            System.out.println ("找到了，下标为=" + index);
        }
    }
    public static int seqSearch(int []arr, int value){
    
    
        for (int i = 0; i < arr.length;i++){
    
    
            if (arr[i] == value){
    
    
                return i;
            }
        }
        return -1;
    }
}

我们在程序中查找-1，应该是可以找到，下标为3；这路需要注意的是：在java中，数组的下标是从0开始，因此，返回的下标为3。具体的执行效果如下所示：

二、二分查找算法

以上介绍的是顺序查找。即在无序的数组中，按从左到右的顺序依次查找。接下来，有一种效率更高的查找方法，即：二分查找。我们以{1,8,10,89,1000，1234}为例进行阐述二分查找的思想：

1. 首先确定该数组的中间的下标mid = (left + right) / 2
2. 然后让需要查找的数 findVal 和 arr[mid] 比较

2.1、findVal > arr[mid] , 说明你要查找的数在mid 的右边, 因此需要递归的向右查找

2.2findVal < arr[mid], 说明你要查找的数在mid 的左边, 因此需要递归的向左查找

2.3 findVal == arr[mid]说明找到，就返回

这里需要我们注意的是：我们什么时候需要结束递归。

1、找到结束递归

2、递归完整数组，仍然没有找到findval，也需要结束递归

3、当left > right就需要退出

根据上述阐述的思路，我们通过代码将其实现：

import java.util.ArrayList;
import java.util.List;

public class BinarySearch {
    
    
    public static void main(String[] args) {
    
    
        int arr[] = {
    
    1, 8, 10, 89, 1000, 1234};
        int resIndex = binarySearch (arr, 0, arr.length - 1, 1000);
        System.out.println ("resIndex=" + resIndex);
        List<Integer> resIndexList = binarySearch2 (arr, 0, arr.length - 1, 1000);
        System.out.println ("resIndexList=" + resIndexList);
    }

    public static int binarySearch(int[] arr, int left, int right, int findVal) {
    
    
        if (left > right) {
    
    
            return -1;
        }
        int mid = (left + right) / 2;
        int midVal = arr[mid];
        if (findVal > midVal) {
    
    
            return binarySearch (arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {
    
    
            return binarySearch (arr, left, mid - 1, findVal);
        } else {
    
    
            return mid;
        }
    }
    public static List<Integer> binarySearch2(int arr[], int left, int right, int findVal){
    
    
        if (left > right){
    
    
            return new ArrayList<Integer> ();
        }
        int mid = left + (right - left)/2;
        int midVal = arr[mid];
        if (findVal > midVal){
    
    
            return binarySearch2 (arr, mid+1, right, findVal);
        }else if (findVal < midVal){
    
    
            return binarySearch2 (arr, left, mid-1, findVal);
        }else {
    
    
            List<Integer> resIndexlist = new ArrayList<Integer> ();
            int temp = mid - 1;
            while (true){
    
    
                if (temp < 0 || arr[temp] != findVal){
    
    
                    break;
                }
                resIndexlist.add (temp);
                temp -= 1;
            }
            resIndexlist.add (mid);
            temp = mid + 1;
            while (true){
    
    
                if (temp > arr.length-1 || arr[temp] != findVal){
    
    
                    break;
                }
                resIndexlist.add (temp);
                temp += 1;
            }
            return resIndexlist;
        }

    }
}

我们找1000，找到的结果如下：

三、插值查找法

插值查找法类似于二分查找，与此不同的是：插值查找每次都是从mid处开始查找。 在折半查找中我们求mid索引的公式，low表示左边索引left；high表示右边索引right，这里的可以就是折半查找中的findVal。具体二者的计算如下：

插值查找的过程如下：

我们以数组 arr = [1, 2, 3, …, 100]为例将其过程进行说明；
假如我们需要查找的值为1：使用二分查找的话，我们需要多次递归，才能找到1；使用插值查找法则只需要int mid = left + (right – left) * (findVal – arr[left]) / (arr[right] – arr[left]);,即具体的来说就是将int mid = 0 + (99 - 0) * (1 - 1)/ (100 - 1) = 0 + 99 * 0 / 99 = 0。另外，假如我们查找的值为100，则：int mid = 0 + (99 - 0) * (100 - 1) / (100 - 1) = 0 + 99 * 99 / 99 = 0 + 99 = 99。

通过上述思路，我们以{1,8,10,89,1000,1234}为例，输入一个数看是否存在此数，并且找到其对应的下标，如果没有，则直接返回“不存在这个数”。具体实现的代码如下：

import java.util.Arrays;
public class InsertValueSearch {
    
    
    public static void main(String[] args) {
    
    
//		int [] arr = new int[100];
//		for(int i = 0; i < 100; i++) {
    
    
//			arr[i] = i + 1;
//		}
        int arr[] = {
    
     1, 8, 10, 89,1000,1000, 1234 };
        int index = insertValueSearch(arr, 0, arr.length - 1, 1234);
        //int index = binarySearch(arr, 0, arr.length, 1);
        System.out.println("index = " + index);

        //System.out.println(Arrays.toString(arr));
    }
    public static int binarySearch(int[] arr, int left, int right, int findVal) {
    
    
        System.out.println("二分查找被调用~");
        // 当 left > right 时，说明递归整个数组，但是没有找到
        if (left > right) {
    
    
            return -1;
        }
        int mid = (left + right) / 2;
        int midVal = arr[mid];

        if (findVal > midVal) {
    
     // 向 右递归
            return binarySearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {
    
     // 向左递归
            return binarySearch(arr, left, mid - 1, findVal);
        } else {
    
    
            return mid;
        }

    }
    public static int insertValueSearch(int[] arr, int left, int right, int findVal) {
    
    

        System.out.println("插值查找次数~~");

        //注意：findVal < arr[0]  和  findVal > arr[arr.length - 1] 必须需要
        //否则我们得到的 mid 可能越界
        if (left > right || findVal < arr[0] || findVal > arr[arr.length - 1]) {
    
    
            return -1;
        }
        // 求出mid, 自适应
        int mid = left + (right - left) * (findVal - arr[left]) / (arr[right] - arr[left]);
        int midVal = arr[mid];
        if (findVal > midVal) {
    
     // 说明应该向右边递归
            return insertValueSearch(arr, mid + 1, right, findVal);
        } else if (findVal < midVal) {
    
     // 说明向左递归查找
            return insertValueSearch(arr, left, mid - 1, findVal);
        } else {
    
    
            return mid;
        }

    }
}

具体的执行效果如下：

当然，插值查找需要注意一些问题：对于数据量大，关键字分布不均匀的情况下，采用插值查找能够很大程度上提高查找的速度。但是插值查找算法也存在一定的弊端。在关键字分布不均匀的情况下，其方法还不如折半查找效率高。

四、斐波那契查找算法

斐波那契查找又称为黄金分割算法。黄金分割点是指一条线分割成两部分，使其中一部分与全长之比等于另一部分与这一部分之比。取其前三位数字的近似值是0.618。由于按此比例设计的造型较为漂亮，因此称之为黄金分割，又称为中外比。而我们经常说的斐波那契数列即为{1,1,2,3,5,8,13……}其实也是斐波那契数列的两个相邻数的比例，无限接近黄金分割值0.618。
其实斐波那契查找的原理与二分查找和插值查找是差不多的，只是改变了中间结点(mid)的位置，mid不在是中间或插值得到，而是位于黄金分割点附近，即mid = low + F(k-1)-1，这里的F代表着斐波那契数列，具体位置如下图所示：

介绍了斐波那契中间查找之后，我们对以下的有序数列进行查找，我们以{1,8,10,89,1000,1234}为例，输入一个数看是否存在此数，并且找到其对应的下标，如果没有，则直接返回“不存在这个数”。具体实现的代码如下：

import java.util.Arrays;
public class FibonacciSearch {
    
    
    public static int maxSize = 20;
    public static void main(String[] args) {
    
    
        int [] arr = {
    
    1,8, 10, 89, 1000, 1234};

        System.out.println("index=" + fibSearch(arr, 189));// 0

    }
    public static int[] fib() {
    
    
        int[] f = new int[maxSize];
        f[0] = 1;
        f[1] = 1;
        for (int i = 2; i < maxSize; i++) {
    
    
            f[i] = f[i - 1] + f[i - 2];
        }
        return f;
    }
    public static int fibSearch(int[] a, int key) {
    
    
        int low = 0;
        int high = a.length - 1;
        int k = 0; //表示斐波那契分割数值的下标
        int mid = 0; //存放mid值
        int f[] = fib(); //获取到斐波那契数列
        //获取到斐波那契分割数值的下标
        while(high > f[k] - 1) {
    
    
            k++;
        }
        //因为 f[k] 值 可能大于 a 的 长度，因此我们需要使用Arrays类，构造一个新的数组，并指向temp[]
        //不足的部分会使用0填充
        int[] temp = Arrays.copyOf(a, f[k]);
        //实际上需求使用a数组最后的数填充 temp
        //举例:
        //temp = {1,8, 10, 89, 1000, 1234, 0, 0}  => {1,8, 10, 89, 1000, 1234, 1234, 1234,}
        for(int i = high + 1; i < temp.length; i++) {
    
    
            temp[i] = a[high];
        }
        // 使用while来循环处理，找到我们的数 key
        while (low <= high) {
    
     // 只要这个条件满足，就可以找
            mid = low + f[k - 1] - 1;
            if(key < temp[mid]) {
    
     //我们应该继续向数组的前面查找(左边)
                high = mid - 1;
                k--;
            } else if ( key > temp[mid]) {
    
     // 我们应该继续向数组的后面查找(右边)
                low = mid + 1;
                k -= 2;
            } else {
    
     //找到
                //需要确定，返回的是哪个下标
                if(mid <= high) {
    
    
                    return mid;
                } else {
    
    
                    return high;
                }
            }
        }
        return -1;
    }
}

具体的执行效果如下：

五、哈希表

哈希表在日常生活中应用也是很广的。尤其是在非关系型数据库中，存储用到的就是哈希表。哈希表也叫散列表。是根据关键码值而直接进行访问数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找速度。这个映射函数叫做散列函数，存放着记录的数组叫做散列表。具体存储的过程：

散列表的具体机构如下：

哈希表的应用很广泛的，我们以一个google公司面试的上机题来说明哈希表具体的应用。题目背景如下：

有一个公司，当有新员工来报道时，要求将该员工的信息加入(id，性别，年龄，名字，住址，…)，当输入该员工的id时候，要求查找到该员工的所有信息。

具体的要求如下：

1、不能使用数据库，速度越快越好

2、添加时，保证id按照从低到高插入

3、使用链表来实现哈希表，该链表不带表头

根据以上的要求，我们有以下的思路：

具体用代码实现如下：

import java.util.Scanner;
public class HashTabDemo {
    
    
    public static void main(String[] args) {
    
    

        //创建哈希表
        HashTab hashTab = new HashTab(7);

        //写一个简单的菜单
        String key = "";
        Scanner scanner = new Scanner(System.in);
        while(true) {
    
    
            System.out.println("add:  添加雇员");
            System.out.println("list: 显示雇员");
            System.out.println("find: 查找雇员");
            System.out.println("exit: 退出系统");

            key = scanner.next();
            switch (key) {
    
    
                case "add":
                    System.out.println("输入id");
                    int id = scanner.nextInt();
                    System.out.println("输入名字");
                    String name = scanner.next();
                    //创建 雇员
                    Emp emp = new Emp(id, name);
                    hashTab.add(emp);
                    break;
                case "list":
                    hashTab.list();
                    break;
                case "find":
                    System.out.println("请输入要查找的id");
                    id = scanner.nextInt();
                    hashTab.findEmpById(id);
                    break;
                case "exit":
                    scanner.close();
                    System.exit(0);
                default:
                    break;
            }
        }

    }

}

//创建HashTab 管理多条链表
class HashTab {
    
    
    private EmpLinkedList[] empLinkedListArray;
    private int size; //表示有多少条链表

    //构造器
    public HashTab(int size) {
    
    
        this.size = size;
        //初始化empLinkedListArray
        empLinkedListArray = new EmpLinkedList[size];
        //？留一个坑, 这时不要分别初始化每个链表
        for(int i = 0; i < size; i++) {
    
    
            empLinkedListArray[i] = new EmpLinkedList();
        }
    }

    //添加雇员
    public void add(Emp emp) {
    
    
        //根据员工的id ,得到该员工应当添加到哪条链表
        int empLinkedListNO = hashFun(emp.id);
        //将emp 添加到对应的链表中
        empLinkedListArray[empLinkedListNO].add(emp);

    }
    //遍历所有的链表,遍历hashtab
    public void list() {
    
    
        for(int i = 0; i < size; i++) {
    
    
            empLinkedListArray[i].list(i);
        }
    }

    //根据输入的id,查找雇员
    public void findEmpById(int id) {
    
    
        //使用散列函数确定到哪条链表查找
        int empLinkedListNO = hashFun(id);
        Emp emp = empLinkedListArray[empLinkedListNO].findEmpById(id);
        if(emp != null) {
    
    //找到
            System.out.printf("在第%d条链表中找到 雇员 id = %d\n", (empLinkedListNO + 1), id);
        }else{
    
    
            System.out.println("在哈希表中，没有找到该雇员~");
        }
    }

    //编写散列函数, 使用一个简单取模法
    public int hashFun(int id) {
    
    
        return id % size;
    }


}
//表示一个雇员
class Emp {
    
    
    public int id;
    public String name;
    public Emp next; //next 默认为 null
    public Emp(int id, String name) {
    
    
        super();
        this.id = id;
        this.name = name;
    }
}

//创建EmpLinkedList ,表示链表
class EmpLinkedList {
    
    
    //头指针，执行第一个Emp,因此我们这个链表的head 是直接指向第一个Emp
    private Emp head; //默认null

    //添加雇员到链表
    //说明
    //1. 假定，当添加雇员时，id 是自增长，即id的分配总是从小到大
    //   因此我们将该雇员直接加入到本链表的最后即可
    public void add(Emp emp) {
    
    
        //如果是添加第一个雇员
        if(head == null) {
    
    
            head = emp;
            return;
        }
        //如果不是第一个雇员，则使用一个辅助的指针，帮助定位到最后
        Emp curEmp = head;
        while(true) {
    
    
            if(curEmp.next == null) {
    
    //说明到链表最后
                break;
            }
            curEmp = curEmp.next; //后移
        }
        //退出时直接将emp 加入链表
        curEmp.next = emp;
    }

    //遍历链表的雇员信息
    public void list(int no) {
    
    
        if(head == null) {
    
     //说明链表为空
            System.out.println("第 "+(no+1)+" 链表为空");
            return;
        }
        System.out.print("第 "+(no+1)+" 链表的信息为");
        Emp curEmp = head; //辅助指针
        while(true) {
    
    
            System.out.printf(" => id=%d name=%s\t", curEmp.id, curEmp.name);
            if(curEmp.next == null) {
    
    //说明curEmp已经是最后结点
                break;
            }
            curEmp = curEmp.next; //后移，遍历
        }
        System.out.println();
    }

    //根据id查找雇员
    //如果查找到，就返回Emp, 如果没有找到，就返回null
    public Emp findEmpById(int id) {
    
    
        //判断链表是否为空
        if(head == null) {
    
    
            System.out.println("链表为空");
            return null;
        }
        //辅助指针
        Emp curEmp = head;
        while(true) {
    
    
            if(curEmp.id == id) {
    
    //找到
                break;//这时curEmp就指向要查找的雇员
            }
            //退出
            if(curEmp.next == null) {
    
    //说明遍历当前链表没有找到该雇员
                curEmp = null;
                break;
            }
            curEmp = curEmp.next;//以后
        }
        return curEmp;
    }
}

具体的执行效果如图所示：

总结

上篇文章给大家介绍了排序算法，主要介绍了排序算法中的主要排序的方式以及十大排序算法的分类。另外还介绍了算法中常见的时间复杂度以及空间复杂度。本文给大家介绍了查找的算法。主要将给大家介绍查找算法的整体介绍以及分别介绍数据结构中常用的几种查找算法，包括线性查找，也叫顺序查找；二分查找、插值查找以及斐波那契查找，最后还介绍了哈希表的相关概念。其实数据结构与算法是特别重要的，在编程中有至关重要的地位，因此，需要我们特别的掌握。生命不息，奋斗不止，我们每天努力，好好学习，不断提高自己的能力，相信自己一定会学有所获。加油！！！