基于PageRank的Lucene排序算法优化与实现
本文选题:Lucene + PageRank ; 参考:《计算机工程与科学》2012年10期
【摘要】:随着Web技术的迅速发展,提供个性化服务的搜索引擎技术受到用户的广泛关注,网页排序是其中的关键技术之一。本文利用PageRank算法对原有的Lucene网页排序进行了改进,设计并实现了关于手机信息搜索的个性化搜索引擎。实验结果证明,改进后的排序算法能够较好地提高信息检索的准确度,为用户带来了优于Lucene自身排序的搜索体验。
[Abstract]:With the rapid development of Web technology, the search engine technology which provides personalized services has been widely concerned by users, among which the ranking of web pages is one of the key technologies. In this paper, the PageRank algorithm is used to improve the ranking of the original Lucene pages, and a personalized search engine for mobile phone information search is designed and implemented. Experimental results show that the improved sorting algorithm can improve the accuracy of information retrieval and bring users a better search experience than Lucene itself.
【作者单位】: 湖北工业大学计算机学院;
【基金】:国家自然科学基金资助项目(61075059) 湖北工业大学校教研项目资助(2011006)
【分类号】:TP391.3
【参考文献】
相关期刊论文 前1条
1 黄知义,周宁;Google搜索引擎的PageRank技术及其优化研究[J];图书馆学研究;2005年08期
相关硕士学位论文 前3条
1 寿周翔;专业搜索引擎的研究与设计[D];浙江大学;2005年
2 史鹏辉;专业服务网站搜索引擎的设计与实现[D];大连理工大学;2004年
3 王亮;搜索引擎及其相关性排序研究[D];武汉大学;2004年
【共引文献】
相关期刊论文 前10条
1 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
2 徐金雷;杨晓江;;基础教育资源搜索引擎的排序算法研究[J];电化教育研究;2007年02期
3 唐培和,杨新伦,刘浩;Google搜索引擎及其实现技术[J];广西工学院学报;2004年02期
4 刘林,汪涛,樊孝忠;主题爬虫的解决方案[J];华南理工大学学报(自然科学版);2004年S1期
5 杨海东,张莉;PageRank技术分析与搜索引擎检索效率研究[J];淮阴师范学院学报(自然科学版);2003年03期
6 杨沅钊,吴薇,喻晓莉,杨国才;搜索引擎排名改进算法分析[J];农业网络信息;2005年02期
7 汪涛,樊孝忠;主题爬虫的设计与实现[J];计算机应用;2004年S1期
8 汪涛,樊孝忠;链接分析对主题爬虫的改进[J];计算机应用;2004年S2期
9 陈再良;凌力;周强;;dPageRank——一种改进的分布式PageRank算法[J];计算机应用;2006年01期
10 葛蓉;利用网络日志分析提高搜索引擎的检准率[J];情报科学;2004年10期
相关会议论文 前1条
1 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
相关博士学位论文 前2条
1 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
2 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
相关硕士学位论文 前10条
1 赵立刚;搜索引擎的研究与设计[D];吉林大学;2005年
2 张巍;基于PageRank算法的搜索引擎优化策略研究[D];四川大学;2005年
3 朱素媛;网络教育中的智能搜索引擎的研究[D];合肥工业大学;2004年
4 谭德坤;文本挖掘及其在UDDI Registry智能检索中的应用[D];昆明理工大学;2004年
5 吴东华;Web信息获取技术研究[D];南京理工大学;2004年
6 陆勇;面向信息检索的汉语同义词自动识别[D];南京农业大学;2005年
7 王斐;基于增量反馈和自适应机制的主题爬虫系统的设计与实现[D];南京理工大学;2005年
8 张玲莉;使用二维可视化技术的网站可用性分析方法的研究与应用[D];大连海事大学;2005年
9 张波;个性化Web搜索系统研究[D];燕山大学;2006年
10 丁邦旭;基于P2P的分布式中文搜索引擎的应用研究[D];南昌大学;2006年
【二级参考文献】
相关期刊论文 前7条
1 林亚平,李彦,童调生,尹锋;汉语自动分词中的神经网络技术研究[J];湖南大学学报(自然科学版);1997年06期
2 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期
3 李洁;搜索引擎中相关性测算发展研究[J];情报杂志;2003年12期
4 桂晓玲;网络环境下信息资源的组织和管理[J];图书馆界;2002年01期
5 刘琨,郑有才;搜索引擎剖析[J];微机发展;2004年03期
6 许涛,吴淑燕;Google搜索引擎及其技术简介[J];现代图书情报技术;2003年04期
7 曹玉霞;搜索引擎新思维[J];现代图书情报技术;2000年05期
【相似文献】
相关期刊论文 前10条
1 张旭;;构建基于本地服务的垂直搜索引擎[J];才智;2011年18期
2 刘兆伟;黄永峰;;面向主题搜索引擎的实现与优化[J];数据通信;2011年04期
3 王福海;;基于PageRank的主题过滤算法改进[J];科技信息;2011年15期
4 梁永演;;浅析搜索引擎的超链接分析排序算法[J];晋图学刊;2011年04期
5 李远方;邓世昆;闻玉彪;韩月阳;;Hadoop-MapReduce下的PageRank矩阵分块算法[J];计算机技术与发展;2011年08期
6 佟兴帆;邓辉宇;李志明;;上海光源产品管理系统及其全文检索子系统的改进[J];核技术;2011年07期
7 陶镇威;周雨程;;基于Compass框架的高级搜索系统的设计与实现[J];重庆理工大学学报(自然科学);2011年08期
8 倪靖;;一种基于云计算的Web结构挖掘算法[J];电脑知识与技术;2011年24期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前10条
1 蔺继国;徐锡山;;一种基于用户点击数据的个性化PageRank算法[A];第六届全国信息检索学术会议论文集[C];2010年
2 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年
3 申兵一;巩青歌;;基于Lucene桌面搜索引擎系统的设计和实现[A];江苏省电子学会2010年学术年会论文集[C];2010年
4 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系统中的应用研究[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
5 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
8 刘源;詹舒波;;基于Solr的行业垂直搜索平台的研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
9 刘寿强;;基于Lucene的分级鉴权企业搜索引擎研究与设计[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
10 王富强;马德涛;张立朝;王建明;;地方志数据库全文信息检索研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
相关重要报纸文章 前1条
1 李映 哲一 (本报记者 李映);微软雅虎结盟 搜索市场风云再起[N];中国电子报;2009年
相关博士学位论文 前3条
1 王菁华;文本中知识的获取[D];北京邮电大学;2008年
2 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
3 韦福如;基于图模型多文档自动文摘研究[D];武汉大学;2009年
相关硕士学位论文 前10条
1 姚林涛;基于Lucene的Web搜索引擎实现[D];西安电子科技大学;2008年
2 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年
3 苏景春;基于Lucene的全文检索系统的研究与应用[D];北京交通大学;2010年
4 陈航哲;基于Lucene的垂直搜索引擎的研究与应用[D];暨南大学;2010年
5 李建林;基于Lucene的Web搜索引擎的研究[D];兰州理工大学;2010年
6 王冬坡;基于Lucene的主题搜索引擎的研究与实现[D];河北科技大学;2010年
7 张彬;基于lucene的搜索引擎[D];上海师范大学;2010年
8 高欣;基于Lucene的全文检索系统的研究与实现[D];天津师范大学;2010年
9 杜先撰;基于Lucene全文索引系统设计与实现[D];南京大学;2011年
10 周月红;基于Lucene的站内搜索引擎的设计与开发[D];华东理工大学;2011年
,本文编号:2101271
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2101271.html