版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_32502511/article/details/86229444
参考地址:https://blog.csdn.net/whb3299065/article/details/80104323
一、业务场景
在利用ik分词的过程中,当ik的分词规则不满足我们的需求了,这个时候就可以利用ik的自定义词库进行筛选,举个例子:当我要将“我是中国人,我想测试一下”这句话通过分词,将“我想测试一下”分为一个词的时候,就需要利用ik的自定义词库进行灌入指定的词。
二、新建词库
1.到elasticsearch/plugins中寻找ik插件所在的目录
2.在ik中的config文件中添加词库
vim taimei_words.dic
输入你定义的词,例如: (注:一行输入一个词)
成都双流
双流机场
:wq!保存命令
3.检查新建词库内容(注意内容中的编码格式)
cat taimei_words.dic
三、修改ik配置
修改config中的IKAnalyzer.cfg.xml文件(注:词库的位置根据该配置文件的位置来决定所写的路径,一般放在平级目录或者下一级目录下)
vim IKAnalyzer.cfg.xml
:wq!保存命令
四、重启es
1.修改为es账户
例如:su es_admin
2.查看es进程号
ps aux|grep elastic
五、测试
可以在postman中测试查看效果,如下图所示,可以看到已经将我设置的“成都双流”当成了一个词典进行分词: