今天就跟大家聊聊有关CDH如何使用Solr实现HBase二级索引,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
站在用户的角度思考问题,与客户深入沟通,找到大冶网站设计与大冶网站推广的解决方案,凭借多年的经验,让设计与互联网技术结合,创造个性化、用户体验好的作品,建站类型包括:成都网站设计、网站制作、企业官网、英文网站、手机端网站、网站推广、域名注册、网站空间、企业邮箱。业务覆盖大冶地区。
1.简单说明
使用Solr构建Hbase二级索引的原理很简单,不过是以空间换取时间,对指定列在Solr中构建索引,最终还是通过rowkey访问Hbase,如下图:
2.四大组件
Hbase+Zookeeper+Solr+Key Value Store(Lily Hbase Indexer)
可见,Hbase与Solr是独立部署的,而让两者发生关系的最核心组件就是Key Value Store.
当然,我们可以不使用现成的K-V Store自己代码实现,大概逻辑也就是:从Hbase中拉取数据然后发起POST请求存到Solr中,Hbase中一行或多行数据对应Solr中一个或多个doc,如图:
3.三个重要的配置文件
schema.xml:对应组件Solr,构建Solr schema,定义了Hbase要构建索引的列,如图:
morphline-hbase-mapper.xml
:让Hbase与Lily发生关系,如图:
morphlines.conf:Hbase与Solr映射关系在此文件中体现,如图:
三个文件的关系图如下,通过这三个文件Hbase,Solr 及 Lyli 也就一一映射起来了,如图:
4.理解Solr
见逻辑视图:
索引对照图:
物理视图与逻辑视图与索引视图:
创建索引过程:Solr提供restful接口
5.了解Hbase结构图
6.了解Lily如何做桥梁
基于Hbase复制功能:
具体执行流程:主类SepConsumer,多线程并发处理
其实就是这么个过程:
看完上述内容,你们对CDH如何使用Solr实现HBase二级索引有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注创新互联行业资讯频道,感谢大家的支持。