大数据分布式全文检索系统的设计与实现
发布时间:2017-10-19 20:50
本文关键词:大数据分布式全文检索系统的设计与实现
更多相关文章: Solr HBase 大数据 搜索 python
【摘要】:论文是基于一种开源企业搜索引擎Solr实现对大数据分布式数据库HBase中数据的检索。论文简单地介绍了分布式存储技术HBase和分布式索引技术SolrCloud,实现了基于Solr和Zookeeper的分布式搜索方式SolrCloud模式对HBase表的索引的建立。该系统通过python程序在对HBase中的Rowkey建立索引的同时还对每列数据都建立索引,实现了Hbase的二级索引,克服了HBase只能通过Rowkey单一查询的不足。经过反复测试,充分地表明了基于Solr的分布式搜索系统的高效性及高可靠性。
【作者单位】: 西安邮电大学;
【关键词】: Solr HBase 大数据 搜索 python
【分类号】:TP391.3
【正文快照】: 1引言随着信息技术的飞速发展,信息化建设是我国现在非常重要的一项工作,而且数据已经渗透到每一个行业和业务领域,成为重要的生产因素。随着大数据时代的到来,越来越多的数据信息呈爆炸式增长,人们对于数据的挖掘和运用,也逐渐因为互联网和信息行业的发展得到人们的关注,因此
【相似文献】
中国期刊全文数据库 前2条
1 赵凯;王敏;;基于Solr的企业级搜索引擎的设计[J];电子世界;2013年22期
2 ;[J];;年期
中国硕士学位论文全文数据库 前6条
1 刘博文;分布式企业搜索引擎的设计与实现[D];浙江大学;2015年
2 王小森;基于Solr的搜索引擎的设计与实现[D];北京邮电大学;2011年
3 李雪利;基于Solr的企业搜索引擎的研究与实现[D];浙江理工大学;2013年
4 蔡学锋;基于Solr的搜索引擎核心技术研究与应用[D];武汉理工大学;2013年
5 李晨鸣;基于solr搜索引擎的问吧系统的设计与实现[D];电子科技大学;2012年
6 张新生;基于solr的分布式搜索引擎研究[D];华中科技大学;2012年
,本文编号:1063273
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1063273.html