基于SolrCloud的网络百科检索服务的实现
本文关键词:基于SolrCloud的网络百科检索服务的实现,由笔耕文化传播整理发布。
【摘要】:网络百科是一部在线百科全书,为用户提供了资源丰富、内容详实的网络查询工具。网络百科检索服务是基于Solr Cloud搭建的检索平台,服务部署在集群上,具有集中式的信息配置、自动容错、近实时搜索和查询时自动负载均衡的特点。本文介绍了Solr Cloud平台的搭建方案,结合数据特点设计了索引结构,增加了中文分词器和中文词表,提高了在创建索引和检索索引过程中的中文分词效果。在Solr Cloud平台基础上,本文根据搜索引擎原理提出了搜索引擎优化方案,进一步提升了搜索效果。通过在创建索引时对关键字段设置多颗粒度分词模式,在检索索引时对不同颗粒度分词设置不同的权重,提高检索效果;通过挖掘数据内在的引用关系为文档质量评分,提高优质文档在搜索结果中的排名。实验数据表明,优化方法对网络百科检索服务效果有很大的提升。
【作者单位】: 北京邮电大学计算机学院;
【关键词】: 计算机软件 搜索引擎优化 Solr Cloud 中文分词
【分类号】:TP391.1
【正文快照】: 0引言1.网络百科是一个包罗万象的在线百科全书,涉及经济、政治、文化等各个方面。网络百科的主体为词条,分为中文和英文,由千万量级的词条构成了庞大的知识库,具有很强的知识性和科普价值,同时又鼓励用户参与创建和修改词条,使网络百科在丰富权威的同时,也具有趣味性和快更新
【参考文献】
中国期刊全文数据库 前2条
1 徐树振;罗学礼;王森;杨莉;段嘉杰;张德刚;;企业非结构化数据检索研究[J];信息技术;2014年04期
2 刘晓婉;胡燕祝;艾新波;;开源中文分词器在web搜索引擎中的应用[J];软件;2013年03期
【共引文献】
中国期刊全文数据库 前3条
1 徐新爱;;无人机海量飞行数据快速检索方法研究[J];计算机测量与控制;2014年12期
2 阮卫华;;搜索引擎优化技术的研究与实现[J];软件;2014年07期
3 徐治;;Visual C++调用MATLAB函数库的混合编程技术[J];软件;2015年02期
中国硕士学位论文全文数据库 前3条
1 曹奇峰;基于Nutch的食品安全信息垂直搜索引擎研究[D];杭州电子科技大学;2014年
2 靳佩瑶;基于内容的网页文本信息过滤技术研究[D];西南石油大学;2015年
3 徐康;基于用户兴趣模型的个性化搜索排序研究[D];浙江理工大学;2015年
【二级参考文献】
中国期刊全文数据库 前9条
1 程志华;倪时龙;黄文思;龚贺;;企业级非结构化数据管理平台研究及实践[J];电力信息化;2012年03期
2 孙铁利;刘延吉;;中文分词技术的研究现状与困难[J];信息技术;2009年07期
3 崔杰;李陶深;兰红星;;基于Hadoop的海量数据存储平台设计与开发[J];计算机研究与发展;2012年S1期
4 费洪晓,康松林,朱小娟,谢文彪;基于词频统计的中文分词的研究[J];计算机工程与应用;2005年07期
5 陈林;杨丹;赵俊芹;;基于语义理解的智能搜索引擎研究[J];计算机科学;2008年06期
6 陈红涛;杨放春;陈磊;;基于大规模中文搜索引擎的搜索日志挖掘[J];计算机应用研究;2008年06期
7 李戴维;李宁;;基于Solr的分布式全文检索系统的研究与实现[J];计算机与现代化;2012年11期
8 邓鹏;李枚毅;何诚;;Namenode单点故障解决方案研究[J];计算机工程;2012年21期
9 林碧英;赵锐;陈良臣;;基于Lucene的全文检索引擎研究与应用[J];计算机技术与发展;2007年05期
中国硕士学位论文全文数据库 前3条
1 王小森;基于Solr的搜索引擎的设计与实现[D];北京邮电大学;2011年
2 王茜;基于字符串匹配的中英文混合分词技术研究[D];四川师范大学;2011年
3 张新生;基于solr的分布式搜索引擎研究[D];华中科技大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 刘莎;;网络百科信息组织模式的调查[J];图书馆理论与实践;2012年05期
2 黄令贺;朱庆华;;网络百科用户贡献行为研究综述[J];图书情报工作;2013年22期
3 冯凯悦;徐建华;;新世纪以来中国“百科全书”研究分析[J];图书馆杂志;2012年05期
4 宋培彦;路青;赵星;;网络百科知识组织方法研究[J];情报资料工作;2012年05期
5 刘月学;贾二鹏;;网络百科信息生态链构成要素与形成机理研究[J];图书馆学研究;2014年02期
6 万力勇;;网络百科用户协同创作的互动机制研究——以百度百科贴吧为例[J];情报杂志;2014年01期
7 秦却;;网络百科的媒体梦[J];新经济导刊;2010年06期
8 丁玉东;张春峰;刘颖;;期刊论文引用中文Wiki网络百科的统计与分析[J];情报杂志;2013年03期
9 许博;;网络百科全书管理机制与公众参与行为研究[J];图书情报知识;2011年03期
10 彭程;;传统百科全书与网络百科的比较研究[J];华北水利水电学院学报(社科版);2012年04期
中国重要报纸全文数据库 前3条
1 本报记者 陶韬;网络百科未必权威准确[N];江苏科技报;2014年
2 实习生 邱明瑜;有问题找百科,,行吗?[N];中国文化报;2014年
3 余靖静 王若阳 孟琳;快乐假期不等于“炫”,高价夏令营遇“寒流”[N];新华每日电讯;2009年
中国硕士学位论文全文数据库 前4条
1 邓孛;基于TAM的网络信息资源用户采纳影响因素研究[D];云南财经大学;2015年
2 杨欣;国内维基类网络百科研究[D];武汉理工大学;2012年
3 戴云海;网络口碑与网络百科用户忠诚度的关系研究[D];江西理工大学;2014年
4 杨宇飞;面向中文网络百科的属性关系抽取研究[D];西南交通大学;2014年
本文关键词:基于SolrCloud的网络百科检索服务的实现,由笔耕文化传播整理发布。
本文编号:497802
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/497802.html