(基础:流程一)CDH Solr 一点通

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xiewendong93/article/details/54971243

流程一: 启动 收集器 与 索引生成器

该流程内容包括

一:创建Hbase数据表

<Hbase shell>
<!--Hbase表开启列簇REPLICATION复制功能-->
create 'test',{NAME => 'cf', REPLICATION_SCOPE => 1}
<!--如建表时已设置REPLICATION_SCOPE=>1 , 该步骤省略-->
disable 'test'
alter 'test',{NAME => 'cf', REPLICATION_SCOPE => 1}
enable 'test'

二:生成并设置Solr配置文件:scheme.xml

(自定义域(名称,类型,是否建索引,是否保存),分词 , 合并其他列等)

<Linux shell>
solrctl instancedir --generate ./test
vi ./test/conf/schema.xml
<!-- solr 索引定义-->
<!-- 
域名随意,避免与该文件默认field名字重复,默认有(id,title等)
名称要与Morphline.conf文件(该文件在第四步生成配置)>中的outputField属性值对应
**属性多且有讲究,该处不做描述
name:自定义域名称
type:域类型
indexed:是否建索引
stored:是否保存
-->
<!-- 在<fields>..</fields>中新增-->
<field name="title_" type="string" indexed="true" stored="true" />

三:创建collection(收集器,个人理解),并将上一步生成设置的配置文件上传Zookeeper,供Solr集群节点下载使用,然后启动收集器

四:生成并配置Lily HBase Indexer配置文件,用于注册Hbase索引,并启动该服务(个人理解:索引生成器)(启动需指定收集器名)

猜你喜欢

转载自blog.csdn.net/xiewendong93/article/details/54971243