版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xiewendong93/article/details/54971243
流程一: 启动 收集器 与 索引生成器
该流程内容包括
一:创建Hbase数据表
<Hbase shell> <!--Hbase表开启列簇REPLICATION复制功能--> create 'test',{NAME => 'cf', REPLICATION_SCOPE => 1} <!--如建表时已设置REPLICATION_SCOPE=>1 , 该步骤省略--> disable 'test' alter 'test',{NAME => 'cf', REPLICATION_SCOPE => 1} enable 'test'
二:生成并设置Solr配置文件:scheme.xml
(自定义域(名称,类型,是否建索引,是否保存),分词 , 合并其他列等)
<Linux shell> solrctl instancedir --generate ./test vi ./test/conf/schema.xml <!-- solr 索引定义--> <!-- 域名随意,避免与该文件默认field名字重复,默认有(id,title等) 名称要与Morphline.conf文件(该文件在第四步生成配置)>中的outputField属性值对应 **属性多且有讲究,该处不做描述 name:自定义域名称 type:域类型 indexed:是否建索引 stored:是否保存 --> <!-- 在<fields>..</fields>中新增--> <field name="title_" type="string" indexed="true" stored="true" />
三:创建collection(收集器,个人理解),并将上一步生成设置的配置文件上传Zookeeper,供Solr集群节点下载使用,然后启动收集器
四:生成并配置Lily HBase Indexer配置文件,用于注册Hbase索引,并启动该服务(个人理解:索引生成器)(启动需指定收集器名)