elasticsearch搜素让某些词不拆分——调研

问题描述:ES内置的分析器在处理中文分词时,简单粗暴的将中文的每一个汉字作为一个词(token)分开;

导致问题:内容较少时,搜索结果不尽人意,常常最终搜索结果匹配的是某个字,极其不匹配不友好;

各种分词工具介绍

关于es分词,可以看看其中的介绍

1、ik-analyzer (IKQueryParser)

2、bosonnlp (玻森数据中文分析器)

猜你喜欢

转载自blog.csdn.net/hgg923/article/details/80365368