概述
最近在搞大数据实时计算,期间在解析时经常会用到 SimpleDateFormat对时间进行格式化。通过观察每天的日志经常会发现下列异常:
java.lang.NumberFormatException: For input string: "" at java.lang.NumberFormatException.forInputString(NumberFormatException.java:48) at java.lang.Long.parseLong(Long.java:431) at java.lang.Long.parseLong(Long.java:468) at java.text.DigitList.getLong(DigitList.java:177) at java.text.DecimalFormat.parse(DecimalFormat.java:1297) at java.text.SimpleDateFormat.subParse(SimpleDateFormat.java:1589) at java.text.SimpleDateFormat.parse(SimpleDateFormat.java:1311) at java.text.DateFormat.parse(DateFormat.java:335) at com.xxxxxxx.core.common.util.DateUtil.parseTimestamp(DateUtil.java:95) at com.xxxxxxx.core.common.util.DateUtil.parse(DateUtil.java:84) at com.xxxxxxx.hbase.generator.LogRowKeyGenerator.generate(LogRowKeyGenerator.java:21) ... 22 more
原因
通过查找资料发现SimpleDateFormat是继承自DateFormat类,该类中直接使用了Calendar成员变量,该变量在多线程中共享,是线程不安全的,关于线程安全可以参考这里。
protected Calendar calendar;
而我们实际中经常在常量类中定义一个如下的对象:
public static final DateFormat DATE_FORMAT = new SimpleDateFormat("yyyy-MM-dd");
在多线程中使用DATE_FORMAT.parse(str)、DATE_FORMAT.format(str)就会遇到上述异常问题。
究其原因,可以看下SimpleDateFormat源码:
public Date parse(String text, ParsePosition pos) { checkNegativeNumberExpression(); int start = pos.index; int oldStart = start; int textLength = text.length(); ........//省略 //establish方法中会调用 calendar.clear(); parsedDate = calb.establish(calendar).getTime(); ........//省略 //采用text 重新给calendar赋值 start = subParse(text, start, tag, count, obeyCount, ambiguousYear, pos, useFollowingMinusSignAsDelimiter); ........//省略 Date parsedDate = calendar.getTime(); return parsedDate }
在多线程高并发情况下,A线程执行完成calendar.clear(),但还没有执行getTime(), B线程又执行calendar.clear()方法,当A线程执行getTime()就会报上述异常java.lang.NumberFormatException: For input string: ""。
报空指针只是其中一种情况,还会有些未知的错误,就是两个线程中的日期串改。
解决办法
我的解决办法就是每次都new SimpleDateFormat()
在工具类中提供一个静态方法每次都new SimpleDateFormat():
public static DateFormat getSimpleDF(){ return new SimpleDateFormat("yyyy-MM-dd"); }
也可以用ThreadLocal来解决在同一个线程中对 DateFormat进行复用,关于ThreadLocal可以参考这里。