Solr中对于返回数据格式有xml、json、javabin等等,其中当传入参数wt=javabin时可以直接返回solr自定义序列化的javabin二进制流。
Solr对对于对象的序列化基本采用以下格式(对于熟悉lucene的同学来说可能更容易理解):
version+[tag+value]
第一个byte表示Version,必须为“1”。下面就是对象的定义了。tag为一个字节,前三位表示tag的名称,后五位表示数据长度。Solr的tag定义如下:
NULL = 0,
BOOL_TRUE = 1,
BOOL_FALSE = 2,
BYTE = 3,
SHORT = 4,
DOUBLE = 5,
INT = 6,
LONG = 7,
FLOAT = 8,
DATE = 9,
MAP = 10,
SOLRDOC = 11,
SOLRDOCLST = 12,
BYTEARR = 13,
ITERATOR = 14,
END = 15,
TAG_AND_LEN = (byte)(1 << 5),
STR = (byte)(1 << 5),
SINT = (byte)(2 << 5),
SLONG = (byte)(3 << 5),
ARR = (byte)(4 << 5), //
ORDERED_MAP = (byte)(5 << 5),
NAMED_LST = (byte)(6 << 5),
EXTERN_STRING = (byte)(7 << 5);
对于Solr的序列化了解以后,我们就可以写代码,对Solr的javabin二进制格式数据进行解析了。