数据结构与算法分析：（六）栈

一、栈的定义

栈是限定仅在表尾进行插入和删除操作的线性表。

允许插入和删除的一端称为栈顶（top），另一端称为栈底（bottom），不含任何数据元素的栈称为空栈。栈又称为后进先出（Last In First Out）的线性表，简称LIFO结构。
栈的插入操作，叫做进栈，也称压栈、入栈。栈的删除操作，叫做出栈，也有的叫做弹栈。

了解完栈的定义后，小伙伴们似乎发现了栈相对于数组和链表来说好像有点鸡肋。是的，没错，功能来讲确实可以替代栈。那为啥要有栈这样的数据结构呢？黑格尔说过：存在即合理。
你要知道，特定的数据结构是对特定场景的抽象，而且，数组或链表暴露了太多的操作接口，操作上的确灵活自由，但使用时就比较不可控，自然也就更容易出错。

当某个数据集合只涉及在一端插入和删除数据，并且满足后进先出、先进后出的特性，我们就应该首选“栈”这种数据结构。

二、如何实现一个栈？

从刚才栈的定义里，我们可以看出，栈主要包含两个操作，入栈和出栈，也就是在栈顶插入一个数据和从栈顶删除一个数据。理解了栈的定义之后，我们来看一看如何用代码实现一个栈。

实际上，栈既可以用数组来实现，也可以用链表来实现。用数组实现的栈，我们叫作顺序栈，用链表实现的栈，我们叫作链式栈。

1、顺序栈

/**
 * 基于数组实现的顺序栈
 */
public class ArrayStack {
    private String[] items;  // 数组
    private int count;       // 栈中元素的个数
    private int n;           // 栈的大小

    // 初始化数组，申请一个大小为n的数组空间
    public ArrayStack(String[] items, int count, int n) {
        this.items = new String[n];
        this.count = 0;
        this.n = n;
    }

    // 入栈操作
    public boolean push(String item) {
        if (count == n) return false;
        items[count] = item;
        count++;
        return true;
    }

    // 出栈操作
    public String pop() {
        if (count == 0) return null;
        String temp = items[count - 1];
        --count;
        return temp;
    }

    // push达到栈的容量时
    public void pushExpansion(String item) {
        if (count == n) {
            n = n * 2;
            String[] newItems = new String[n];
            for (int i = 0; i < items.length; i++) {
                newItems[i] = items[i];
            }
            // 清空原数组
            items = null;
            // 重新赋值
            items = newItems;
        }
        items[count] = item;
        ++count;
    }
}

2、链式栈

/**
 * 基于链表实现的栈
 */
public class LinkedListStack {

    private ListNode top = null;

    public void push(int data) {
        ListNode newNode = new ListNode(data);
        // 判断是否栈空
        if (top == null) {
            top = newNode;
        } else {
            newNode.next = top;
            top = newNode;
        }
    }

    public int pop() {
        if (top == null) return 0;// 这里我用0表示栈中没有数据
        int data = top.data;
        top = top.next;
        return data;
    }

    public void printAll() {
        ListNode temp = null;
        while (temp != null) {
            System.out.print(temp.data + "->");
            temp = temp.next;
        }
        System.out.println();
    }

}

代码写完了，那它们的时间复杂度和空间复杂度各是多少呢？

不管是顺序栈还是链式栈，我们存储数据只需要一个大小为 n 的数组就够了。在入栈和出栈过程中，只需要一两个临时变量存储空间，所以空间复杂度是 O(1)。

注意，这里存储数据需要一个大小为 n 的数组，并不是说空间复杂度就是 O(n)。因为，这 n 个空间是必须的，无法省掉。所以我们说空间复杂度的时候，是指除了原本的数据存储空间外，算法运行还需要额外的存储空间。

不管是顺序栈还是链式栈，入栈、出栈只涉及栈顶个别数据的操作，所以时间复杂度都是 O(1)。

在上面的顺序栈我们的代码有写到push达到栈的容量时，数组的容量变成之前的两倍，这就是支持动态扩容的顺序栈。

那支持动态扩容的顺序栈的时间复杂度、空间复杂度又是多少呢？

第一章我们专门讲了时间、空间复杂度分析方法，这难不倒我们。

对于出栈操作来说，我们不会涉及内存的重新申请和数据的搬移，所以出栈的时间复杂度仍然是 O(1)。
但是，对于入栈操作来说，情况就不一样了。当栈中有空闲空间时，入栈操作的时间复杂度为 O(1)。但当空间不够时，就需要重新申请内存和数据搬移，所以时间复杂度就变成了 O(n)。

也就是说，对于入栈操作来说，最好情况时间复杂度是 O(1)，最坏情况时间复杂度是 O(n)。那平均情况下的时间复杂度又是多少呢？我们在第一篇中讲了的摊还分析法。这个入栈操作的平均情况下的时间复杂度可以用摊还分析法来分析。我们也正好借此来实战一下摊还分析法。

如果当前栈大小为 K，并且已满，当再有新的数据要入栈时，就需要重新申请 2 倍大小的内存，并且做 K 个数据的搬移操作，然后再入栈。但是，接下来的 K-1 次入栈操作，我们都不需要再重新申请内存和搬移数据，所以这 K-1 次入栈操作都只需要 O(1) (不涉及内存搬移的操作)操作就可以完成。为了让你更加直观地理解这个过程，请看下图：

在这里插入图片描述

通过这个例子的实战分析，也印证了前面讲到的，均摊时间复杂度一般都等于最好情况时间复杂度。因为在大部分情况下，入栈操作的时间复杂度 O 都是 O(1)，只有在个别时刻才会退化为 O(n)，所以把耗时多的入栈操作的时间均摊到其他入栈操作上，平均情况下的耗时就接近 O(1)。

三、栈的应用

1、栈在函数调用中的应用

栈最经典的一个应用场景你应该也知道吧，那就是函数调用栈。我们平时debug调试代码，原理就是函数调用栈。

我们知道，操作系统给每个线程分配了一块独立的内存空间，这块内存被组织成栈这种结构, 用来存储函数调用时的临时变量。每进入一个函数，就会将临时变量作为一个栈帧入栈，当被调用函数执行完成，返回之后，将这个函数对应的栈帧出栈。

public static void main(String[] args) {
    int a = 1;
    int ret = 0;
    int res = 0;
    ret = add(3, 5);
    res = a + ret;
    System.out.println(res);
}

private static int add(int x, int y) {
    int sum = 0;   
    sum = x + y;   
    return sum;
}

从代码中我们可以看出，main() 函数调用了 add() 函数，获取计算结果，并且与临时变量 a 相加，最后打印 res 的值。我们来看下图中对应的函数栈里出栈、入栈的操作，在执行到 add() 函数时，函数调用栈的情况。

在这里插入图片描述

2、栈在表达式求值中的应用

我们再来看栈的另一个常见的应用场景，编译器如何利用栈来实现表达式求值。

为了方便理解，我将算术表达式简化为只包含加减乘除四则运算，比如：34+13*9+44-12/3。对于这个四则运算，如果让你来实现这样一个表达式求值的功能，你会怎么做呢？

实际上，编译器就是通过两个栈来实现的。其中一个保存操作数的栈，另一个是保存运算符的栈。我们从左向右遍历表达式，当遇到数字，我们就直接压入操作数栈；当遇到运算符，就与运算符栈的栈顶元素进行比较。

如果比运算符栈顶元素的优先级高，就将当前运算符压入栈；如果比运算符栈顶元素的优先级低或者相同，从运算符栈中取栈顶运算符，从操作数栈的栈顶取 2 个操作数，然后进行计算，再把计算完的结果压入操作数栈，继续比较。

计算详情可参考下图：

在这里插入图片描述

3、栈在括号匹配中的应用

我们还可以借助栈来检查表达式中的括号是否匹配。

我们来看下面一个例子：

输入一组括号，请判断这些括号的匹配是否合法。例如

(()]，不合法，左边的小括号与右边的中括号不能匹配。
{[()]}，合法的，所有的括号都可以正确匹配。
{(})，不合法，顺序是错的。
((())，不合法，右括号少了一个。

我们来分析一下。如果遇到第一个右括号，那与之配对的一定是离它最近的那个左括号，如果离它最近的左括号的类型与这个右括号的类型是一样的（比如都是小括号），那这就是一次成功的配对。把一组成功配对的括号从括号序列中删去，不会影响原来序列是否合法这个属性，就是说原来合法的，仍然合法，原来不合法的，仍然不合法。通过这样的办法就可以化简题目了。

算法是有了，怎么实现呢？遇到右括号，只去检查离它最近的，如果匹配上了，就把左右括号一起删掉，这不就是栈吗？每次都只检查栈顶的左括号，如果与右括号匹配上了，就把左括号出栈（删掉）。

数据结构与算法都有了，程序也就简单了。

/**
 * 栈在括号匹配中的应用
 */
public class BracketMatchingStack {
    public static void main(String[] args) throws IOException {
        byte[] buf = new byte[128];
        int length = System.in.read(buf);
        ByteStack stack = new ByteStack(buf, length);

        for (int i = 0; i < length; i++) {
            if (buf[i] == '(' || buf[i] == '[' || buf[i] == '{') {
                stack.push(buf[i]);
            } else if (buf[i] == ')') {
                if (stack.getTop() == '(')
                    stack.pop();
                else {
                    System.out.println("1 unmatch!");
                    System.exit(1);
                }
            } else if (buf[i] == ']') {
                if (stack.getTop() == '[')
                    stack.pop();
                else {
                    System.out.println("2 unmatch!");
                    System.exit(1);
                }
            }
            else if (buf[i] == '}') {
                if (stack.getTop() == '{')
                    stack.pop();
                else {
                    System.out.println("3 unmatch!");
                    System.exit(1);
                }
            }
        }

        if (!stack.isEmpty()) {
            System.out.println("4 unmatch!");
        } else {
            System.out.println("matched~");
        }
    }
}

/**
 * 基于字符数组实现的顺序栈
 */
public class ByteStack {

    private byte[] bytes;    // 字符数组
    private int count;       // 栈中元素的个数
    private int n;           // 栈的大小

    // 初始化数组，申请一个大小为n的数组空间
    public ByteStack(byte[] bytes, int n) {
        this.bytes = new byte[n];
        this.count = 0;
        this.n = n;
    }

    // 入栈操作
    public boolean push(byte item) {
        if (count == n) return false;
        bytes[count] = item;
        count++;
        return true;
    }

    // 出栈操作
    public byte pop() {
        if (count == 0) return 0;
        byte temp = bytes[count - 1];
        --count;
        return temp;
    }

    // 获取栈顶元素的值，不出栈。
    public byte getTop() {
        if (count == 0) return 0;
        return bytes[count - 1];
    }

    // 判断栈是否为空
    public boolean isEmpty() {
        return count == 0;
    }
}

四、知识拓展

1、我们在讲栈的应用时，讲到用函数调用栈来保存临时变量，为什么函数调用要用“栈”来保存临时变量呢？用其他数据结构不行吗？

2、我们都知道，JVM 内存管理中有个“堆栈”的概念。栈内存用来存储局部变量和方法调用，堆内存用来存储 Java 中的对象。那 JVM 里面的“栈”跟我们这里说的“栈”是不是一回事呢？如果不是，那它为什么又叫作“栈”呢？

1、其实，我们不一定非要用栈来保存临时变量，只不过如果这个函数调用符合后进先出的特性，用栈这种数据结构来实现，是最顺理成章的选择。

从调用函数进入被调用函数，对于数据来说，变化的是什么呢？是作用域。所以根本上，只要能保证每进入一个新的函数，都是一个新的作用域就可以。而要实现这个，用栈就非常方便。在进入被调用函数的时候，分配一段栈空间给这个函数的变量，在函数结束的时候，将栈顶复位，正好回到调用函数的作用域内。

2、内存中的堆栈和数据结构堆栈不是一个概念，可以说内存中的堆栈是虚拟的内存空间，是物理内存的映射，而数据结构中的堆栈是抽象的数据存储结构。

内存空间在逻辑上分为三部分：代码区、静态数据区和动态数据区，动态数据区又分为栈区和堆区。

代码区：存储方法体的二进制代码。高级调度（作业调度）、中级调度（内存调度）、低级调度（进程调度）控制代码区执行代码的切换。

静态数据区：存储全局变量、静态变量、常量，常量包括final修饰的常量和String常量。系统自动分配和回收。

栈区：存储运行方法的形参、局部变量、返回值。由系统自动分配和回收。

堆区：new一个对象的引用或地址一般存储在栈区，指向该对象存储在堆区中的真实数据。对象不仅可以在堆中分配（大多数情况下是这样），jvm有逃逸分析优化可以让未逃逸的对象在栈上分配（hotspot虚拟机上采用了标量替换来实现对象在栈上的分配）。

riemann_

发布了386 篇原创文章 · 获赞 313 · 访问量 21万+

私信关注