ElasticSearch的ik分词器下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases。
分析器Analyzer:ik_smart,ik_max_work,
分词器Tokenizer:ik_smart,ik_max_work
1、安装ik分词器
安装ik分词器时注意版本与elasticsearch版本保持一致(https://github.com/medcl/elasticsearch-analysis-ik/releases)。选择下载版本如下图:
我们选择zip包进行下载,安装操作如下:
[root@wzy10 ~]# su - elk -s /bin/bash
#解压
[elk@wzy10 ~]$ unzip elasticsearch-analysis-ik-6.2.x.zip
#unzip后的目录名称为elasticsearch
[elk@wzy10 ~]$ll
drwxrwxrwx 3 elk elk 213 May 6 2018 elasticsearch
#把目录名改一下,防止安装别的插件时同名冲突;这里修改为ik-analyzer
[elk@wzy10 ~]$ mv elasticsearch ik-analyzer
[elk@wzy10 ~]$ mv ik-analyzer /usr/local/elasticsearch/plugins/
[elk@wzy10 ~]$ cd /usr/local/elasticsearch/plugins/
[elk@wzy10 plugins]$ ll
total 0
drwxrwxrwx 3 elk elk 213 May 6 2018 ik-analyzer
[elk@wzy10 plugins]$ cd ik-analyzer/
[elk@wzy10 ik-analyzer]$ ll
total 1420
-rw-r--r-- 1 elk elk 263965 May 6 2018 commons-codec-1.9.jar
-rw-r--r-- 1 elk elk 61829 May 6 2018 commons-logging-1.2.jar
drwxr-xr-x 2 elk elk 299 May 6 2018 config
-rw-r--r-- 1 elk elk 51438 May 6 2018 elasticsearch-analysis-ik-6.2.4.jar
-rw-r--r-- 1 elk elk 736658 May 6 2018 httpclient-4.5.2.jar
-rw-r--r-- 1 elk elk 326724 May 6 2018 httpcore-4.4.4.jar
-rw-r--r-- 1 elk elk 1805 May 6 2018 plugin-descriptor.properties
重启一下ElasticSearch
[elk@wzy10 ~]$ jps
2546 Jps
2458 Elasticsearch
[elk@wzy10 ~]$ kill 2458
[elk@wzy10 ~]$ /usr/local/elasticsearch/bin/start.sh
2、扩展词库
由于我们ElasticSearch安装目录是/usr/local/elasticsearch/,ik中文分词器的目录是/usr/local/elasticsearch/plugins/ik-analyzer,所以扩展词库文件/usr/local/elasticsearch/plugins/ik-analyzer/config/IKAnalyzer.cfg.xml。
【默认IKAnalyzer.cfg.xml配置】
[elk@wzy10 ~]$ cat /usr/local/elasticsearch/plugins/ik-analyzer/config/IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict"></entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords"></entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
【我们自定义】
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">custom/ext_stopword.dic</entry>
<!--用户可以在这里配置远程扩展字典 -->
<entry key="remote_ext_dict">location</entry>
<!--用户可以在这里配置远程扩展停止词字典-->
<entry key="remote_ext_stopwords">http://xxx.com/xxx.dic</entry>
</properties>
3、测试ik分词器