由于年索引数据量大,目前打算分20个shard做集群
硬件:(32G内存、8核CPU、每台服务器挂载4块500G的ssd硬盘) X 5台
目前有两种方式搭建:
一.每个solr实例对应一个盘,共要开启20个实例
solr -c -m 8g -z xx1:2181,xx2:2181,xx3:2181,xx4:2181,xx5:2181 -s /mnt/disk1/data/solrcloud/solr1 -p 8941
solr -c -m 8g -z xx1:2181,xx2:2181,xx3:2181,xx4:2181,xx5:2181 -s /mnt/disk2/data/solrcloud/solr2 -p 8942
...
20个实例创建完毕后使用如下solr命令:
http://xxx:xxx/solr/admin/collections?action=CREATE&name=uuwatch-year2016&numShards=20&router.field=group (系统要去重,采用路由方式为group字段)
二.如果只想要开启5个实例,在上面搭好的基础上改造一下即可(经测试,此种方式的索引和检索效率更高)
1).在/home/wp/data目录下建立软连接,分别链到之前创建20个实例对应的solr.home下的的索引文件夹
新的solr.home的目录结构如下图:
2)在其它机器上依次做如上操作
3)停掉所有机器的服务
4)在每台机器上执行如下命令
solr -c -m 28g -z xx1:2181,xx2:2181,xx3:2181,xx4:2181,xx5:2181 -s /home/wp/data -p 8941
最后,如下所示(经测试,文档路由方式也能正常工作):