solrcloud分布式集群部署zookeeper集群安装+ClientCRUD实例
附件含:操作说明文档;客户端CRUD实现
?
工具下载
zookeeper下载地址:http://hadoop.apache.org/zookeeper/releases.html
solr下载地址:https://archive.apache.org/dist/lucene/solr
?
SolrCloud是基于Solr和Zookeeper的分布式搜索方案,是正在开发中的Solr4.0(目前还是ALPHA版本,基于 lucene4.0)的核心组件之一,它的主要思想是使用Zookeeper作为集群的配置信息中心。它有几个特色功能:1)集中式的配置信息 2)自动容错 3)近实时搜索 4)查询时自动负载均衡 。
下载地址:http://lucene.apache.org/solr/downloads.html
?
准备工作
虚拟机环境:VMware
虚拟机:centOS6.4
须知:
????????? 我们 使用Solr Replication可以实现Solr服务器的可用性,即使某一个索引副本由于磁盘介质故障或者误操作删除等,其他的多个复制副本仍然可以提供服务。如 果只是单纯的基于Solr Replication技术,只能对一个索引进行管理维护,当索引数据达到一定规模,搜索的性能成了瓶颈,除了重新规划设计索引,实现逻辑划分以外,没有 更好地方法实现查询服务器的可扩展性。
SolrCloud 就是为了解决这个问题而提出的。SolrCloud通过ZooKeeper集群来进行协调,使一个索引(SolrCloud中叫做一个 Collection)进行分片,各个分片可以分布在不同的物理节点上,而且,对于同一个Collection的多个分片(Shard)之间没有交集,亦 即,多个物理分片组成一个完成的索引Collection。为了保证分片数据的可用性,SolrCloud自动支持Solr Replication,可以同时对分片进行复制,冗余存储。下面,我们基于Solr最新的4.3.1版本进行安装配置SolrCloud集群,通过实践 来实现索引数据的分布存储和检索。
详细操作见附件
附件含:操作说明文档;客户端CRUD实现