并发编程坑

由一个简单的例子引出并发处理时容易被忽视的陷阱，用来作为面试问题应该很适合。

某日，工作了 4 年多的 Java 程序员小 K 跳槽，面试时碰到这样一个题目....

 
        public 
        class 
        P1 { 
       
        private 
        long 
        b =  
        0 
        ; 
       
        public 
        void 
        set1() { 
       
        b =  
        0 
        ; 
       
        } 
       
        public 
        void 
        set2() { 
       
        b = - 
        1 
        ; 
       
        } 
       
        public 
        void 
        check() { 
       
        System.out.println(b); 
       
        if 
        ( 
        0 
        != b && - 
        1 
        != b) { 
       
        System.err.println( 
        "Error" 
        ); 
       
        } 
       
        } 
       
        }

问题

调用 set1()、set2()、check()，会打印出 Error 么？

小K 的推理

“无论如何调用 set1()、set2() -> b 的值只可能是 0 或 -1 -> 在 check() 里面的判断条件（b 既不为 0 也不为 -1）永远不成立 -> 不打印 Error”

小 K 觉得有坑：这题目应该不会这么简单，再考虑一下多线程环境。

思前想后，小 K 得出结论：“在多线程环境下也不会打印 Error。这题目很简单，就是考察一下推理吧。”，K 暗自窃喜。

后来小 K 陆续又被问了几个多线程和 JVM 的问题。

后来，就没有后来了....

后来

后来还是有的。到家后，不甘心的小 K 验证了这道秒杀他的面试题。

 
        public 
        static 
        void 
        main( 
        final 
        String[] args) { 
       
        final 
        P1 v =  
        new 
        P1(); 
       
        // 线程 1：设置 b = 0 
       
        final 
        Thread t1 =  
        new 
        Thread() { 
       
        public 
        void 
        run() { 
       
        while 
        ( 
        true 
        ) { 
       
        v.set1(); 
       
        } 
       
        }; 
       
        }; 
       
        t1.start(); 
       
        // 线程 2：设置 b = -1 
       
        final 
        Thread t2 =  
        new 
        Thread() { 
       
        public 
        void 
        run() { 
       
        while 
        ( 
        true 
        ) { 
       
        v.set2(); 
       
        } 
       
        }; 
       
        }; 
       
        t2.start(); 
       
        // 线程 3：检查 0 != b && -1 != b 
       
        final 
        Thread t3 =  
        new 
        Thread() { 
       
        public 
        void 
        run() { 
       
        while 
        ( 
        true 
        ) { 
       
        v.check(); 
       
        } 
       
        }; 
       
        }; 
       
        t3.start(); 
       
        }

使用 3 个线程分别重复执行 set1()、set2()、check()。执行输出结果部分如下：

 
        .... 
       
        0 
       
        0 
       
        1 
       
        1 
       
        1 
       
        Error 
       
        Error 
       
        -4294967296 
       
        0 
       
        0 
       
        4294967295 
       
        ....

执行环境：

Java(TM) SE Runtime Environment (build 1.6.0_31-b05)

Java HotSpot(TM) Client VM (build 20.6-b01, mixed mode, sharing), 32bit

“确实打印了 Error，并且打印了 4294967295、-4294967296。我勒个去，只是啥情况？”

小 K 决定搞懂其中奥秘，重新审视了题目。以一个专业程序员的严谨，并经过无数次 Google 后....他似乎发现了问题所在。

“这确实是一个并发问题！”

分析

这道题目有两个陷阱，分别考察了对并发执行的理解，以及对 JVM 基础（赋值操作）的掌握。

陷阱一：并发执行

并发执行就是多个操作一起执行，CPU 执行不同上下文（可理解为不同线程）发过来的指令。操作系统上层看上去就像是并行处理一样。

也就是说，在编程语言层面，一个简单的操作同样需要考虑并发问题。

小 K 首先是栽在了 check() 中的 if 判断上和设值是存在并发的，不能保证 0 != b 这个判断真（此时 b 为 -1）后恰好 b 被赋值为 0 时判断 1 != b。

除此外，无论 JVM、操作系统、CPU 层面对指令如何优化、重排，最终都是逐一执行单一指令，唯一不同的就是不同层面可能会对执行加以限制，

比如加入原子操作，最终保证 CPU 能够完整执行一组指令。

陷阱二：JVM 赋值操作

一些赋值操作不是原子性的。“纳尼？”

Java 基础类型中，long 和 double 是 64 位长的。32 位架构 CPU 的算术逻辑单元（ALU）宽度是 32 位的，在处理大于 32 位操作时需要处理两次。

“这不是<计算机组成原理与汇编>么”，小 K 顿时感到大学白上了，不懂学以致用 T_T~

题目执行打印 4294967295、-4294967296 就是因为读时高 32 位或低 32 位被其他写覆盖了（看一下这两个数字的二进制就知道了）。

Java 已经是封装底层细节很好的语言了，但依然需要注意这些陷阱，可以使用并发处理包 java.util.concurrent.atomic 中包含了一系列无锁原子操作类型，

也可以使用 volatile 关键字保证线程间变量的可见性。

其实这道题目只要解决了并发问题，也就保证了每个执行单元（set1()、set2()、check()）中赋值、比较的正确性。可以把同步方法执行看作序列化的事务，各中操作不会相互影响。

再后来

虽然小 K 面试挂了，不过他挂得心服口服。

通过这个期间的不断翻阅文档以及实验，小 K 下次的面试应该不会被类似的题目秒杀了吧....

“按照这个简单面试题的标准，以前写过的程序简直就是通篇 bugs 啊！有木有，有木有啊！！！！”

非原子的64位操作

当线程在没有同步的情况下读取变量时，可能会得到一个失效值，但至少这个值是由之前某个线程设置的值，而不是一个随机值。这种安全性保证也被称为最低安全性( out-of-thin-air safety)。

最低安全性适用于绝大多数变量，但是存在一个例外：非volatile 类型的64位数值变量（double和long，请参见3.1.4节）。Java内存模型要求，变量的读取操作和写入操作都必须是原子操作，但对于非volatile类型的long和double变量，JVM允许将64位的读操作或写操作分解为两个32位的操作。当读取一个非volatile类型的long变量时，如果对该变量的读操作和写操作在不同的线程中执行，那么很可能会读取到某个值的高32位和另一个值的低32位。因此，即使不考虑失效数据问题，在多线程程序中使用共享且可变的long和double等类型的变量也是不安全的，除非用关键字volatile来声明它们，或者用锁保护起来。

猜你喜欢