Solr—2.window环境-中文分词器和Dataimport

Solr—1.window环境-单机部署  环境部署完毕后,接下来配置中文分词器和导入数据库数据。

目录

配置中文分词器

导入数据库数据


配置中文分词器

solr安装包中自带中文分词器,但是不是那么十分的好用,各类的教学视频都建议使用ik分词器,所以接下来配置ik分词器。

(1)将ik分词器的jar包(ik-analyzer-solr7x.jar)放到apache-tomcat-solr\webapps\solr\WEB-INF\lib下

(2)修改对应的core下的managed-schema配置文件,添加分词器配置,我这里修改solr_home\core-test01\conf\managed-schema配置文件。将下面的一段配置代码放在其他fieldType 标签附近即可。

 <fieldType name="text_ik" class="solr.TextField">
    <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
  </fieldType>

(3)重启服务,进入后台选择我们配置的core

(4)选择图中Analysis 输入一段汉字,选择我们配置的ik分词器,然后点击蓝色按钮,出现图中标识分词器配置成功。

导入数据库数据

(1)相关jar包导入,这里我用的是mysql5.7数据库

数据库驱动包mysql-connector-java-5.1.37-bin.jar 和  solr-7.7.2\dist下的solr-dataimporthandler-7.7.2.jar 和 solr-dataimporthandler-extras-7.7.2.jar

复制上面三个jar包到\webapps\solr\WEB-INF\lib下面

(2)修改配置文件db-data-config.xml

复制solr-7.7.2\example\example-DIH\solr\db\conf\db-data-config.xml

到solr_home\core-test01\conf下,修改名称为data-config.xml(不修改也行的)

修改内容为如下,里面的账号密码需改为自己的,如果用的其他数据修改驱动jar包即可。

用sql语句查询出,需要导入的字段。

<dataConfig>
		<dataSource type="JdbcDataSource" 
									  driver="com.mysql.jdbc.Driver"
									  url="jdbc:mysql://localhost:3306/story" 
									  user="root" 
									  password="root1234"/>
		<document>
			<entity name="article" 
					query="
select article_id,article_title,article_content,create_time from article">
			</entity>
		</document>
</dataConfig>

(3)修改配置文件managed-schema,注意字段要和上面的一样

<field name="article_id" type="string" indexed="true" stored="true"   multiValued="false"/>
  <field name="artilce_title" type="text_ik" indexed="true" stored="true"   multiValued="false"/>
  <field name="article_content" type="text_ik" indexed="true" stored="true"   multiValued="false"/>
  <field name="create_time" type="pdate" indexed="true" stored="true" multiValued="false"/>

(4)重启solr服务,进行验证,选择core,数据导入,选择配置的实体,然后执行导入即可

(5)选择查询,查询所有,数据已经正确查询出来。

猜你喜欢

转载自blog.csdn.net/lchlaughing/article/details/102776363