并发编程坑

由一个简单的例子引出并发处理时容易被忽视的陷阱,用来作为面试问题应该很适合。

某日,工作了 4 年多的 Java 程序员小 K 跳槽,面试时碰到这样一个题目....

public class P1 {
 
     private long b = 0 ;
 
     public void set1() {
         b = 0 ;
     }
 
     public void set2() {
         b = - 1 ;
     }
 
     public void check() {
         System.out.println(b);
 
         if ( 0 != b && - 1 != b) {
             System.err.println( "Error" );
         }
     }
}

 

问题

调用 set1()、set2()、check(),会打印出 Error 么?

 

小K 的推理

“无论如何调用 set1()、set2() -> b 的值只可能是 0 或 -1 -> 在 check() 里面的判断条件(b 既不为 0 也不为 -1)永远不成立 -> 不打印 Error”

小 K 觉得有坑:这题目应该不会这么简单,再考虑一下多线程环境。

思前想后,小 K 得出结论:“在多线程环境下也不会打印 Error。这题目很简单,就是考察一下推理吧。”,K 暗自窃喜。

后来小 K 陆续又被问了几个多线程和 JVM 的问题。

后来,就没有后来了....

后来

后来还是有的。到家后,不甘心的小 K 验证了这道秒杀他的面试题。

public static void main( final String[] args) {
     final P1 v = new P1();
 
     // 线程 1:设置 b = 0
     final Thread t1 = new Thread() {
         public void run() {
             while ( true ) {
                 v.set1();
             }
         };
     };
     t1.start();
 
     // 线程 2:设置 b = -1
     final Thread t2 = new Thread() {
         public void run() {
             while ( true ) {
                 v.set2();
             }
         };
     };
     t2.start();
 
     // 线程 3:检查 0 != b && -1 != b
     final Thread t3 = new Thread() {
         public void run() {
             while ( true ) {
                 v.check();
             }
         };
     };
     t3.start();
}

使用 3 个线程分别重复执行 set1()、set2()、check()。执行输出结果部分如下:

....
0
0
1
1
1
Error
Error
-4294967296
0
0
4294967295
....

执行环境:

    Java(TM) SE Runtime Environment (build 1.6.0_31-b05)

    Java HotSpot(TM) Client VM (build 20.6-b01, mixed mode, sharing), 32bit

“确实打印了 Error,并且打印了 4294967295、-4294967296。我勒个去,只是啥情况?”

小 K 决定搞懂其中奥秘,重新审视了题目。以一个专业程序员的严谨,并经过无数次 Google 后....他似乎发现了问题所在。 

“这确实是一个并发问题!”

分析

这道题目有两个陷阱,分别考察了对并发执行的理解,以及对 JVM 基础(赋值操作)的掌握。

 

陷阱一:并发执行

并发执行就是多个操作一起执行,CPU 执行不同上下文(可理解为不同线程)发过来的指令。操作系统上层看上去就像是并行处理一样。

也就是说,在编程语言层面,一个简单的操作同样需要考虑并发问题。

小 K 首先是栽在了 check() 中的 if 判断上和设值是存在并发的,不能保证 0 != b 这个判断真(此时 b 为 -1)后恰好 b 被赋值为 0 时判断 1 != b。

除此外,无论 JVM、操作系统、CPU 层面对指令如何优化、重排,最终都是逐一执行单一指令,唯一不同的就是不同层面可能会对执行加以限制,

比如加入原子操作,最终保证 CPU 能够完整执行一组指令。

陷阱二:JVM 赋值操作

一些赋值操作不是原子性的。“纳尼?”

Java 基础类型中,long 和 double 是 64 位长的。32 位架构 CPU 的算术逻辑单元(ALU)宽度是 32 位的,在处理大于 32 位操作时需要处理两次。

“这不是<计算机组成原理与汇编>么”,小 K 顿时感到大学白上了,不懂学以致用 T_T~

题目执行打印 4294967295、-4294967296 就是因为读时高 32 位或低 32 位被其他写覆盖了(看一下这两个数字的二进制就知道了)。

Java 已经是封装底层细节很好的语言了,但依然需要注意这些陷阱,可以使用并发处理包 java.util.concurrent.atomic 中包含了一系列无锁原子操作类型,

也可以使用 volatile 关键字保证线程间变量的可见性。

其实这道题目只要解决了并发问题,也就保证了每个执行单元(set1()、set2()、check())中赋值、比较的正确性。可以把同步方法执行看作序列化的事务,各中操作不会相互影响。

再后来

虽然小 K 面试挂了,不过他挂得心服口服。

通过这个期间的不断翻阅文档以及实验,小 K 下次的面试应该不会被类似的题目秒杀了吧....

“按照这个简单面试题的标准,以前写过的程序简直就是通篇 bugs 啊!有木有,有木有啊!!!!”

非原子的64位操作

当线程在没有同步的情况下读取变量时,可能会得到一个失效值,但至少这个值是由之前某个线程设置的值,而不是一个随机值。这种安全性保证也被称为最低安全性( out-of-thin-air safety)。

最低安全性适用于绝大多数变量,但是存在一个例外:非volatile 类型的64位数值变量(double和long,请参见3.1.4节)。Java内存模型要求,变量的读取操作和写入操作都必须是原子操作,但对于非volatile类型的long和double变量,JVM允许将64位的读操作或写操作分解为两个32位的操作。当读取一个非volatile类型的long变量时,如果对该变量的读操作和写操作在不同的线程中执行,那么很可能会读取到某个值的高32位和另一个值的低32位。因此,即使不考虑失效数据问题,在多线程程序中使用共享且可变的long和double等类型的变量也是不安全的,除非用关键字volatile来声明它们,或者用锁保护起来。

猜你喜欢

转载自u011820505.iteye.com/blog/2312199