基于Nutch的网页排序算法研究
本文关键词:基于Nutch的网页排序算法研究
更多相关文章: 网页排序算法 Nutch PageRank 语义相似度
【摘要】:网页排序算法对根据用户查询词搜索到的大量页面进行排序,从而返回给用户,因此排序算法对搜索引擎的好坏起着关键作用。Nutch搜索引擎只实现了基本的综合排序模型,针对Nutch默认排序算法的不足,在Page Rank算法中加入时间因子、链接权重因子,并结合How Net来计算网页的语义相似度,将改进后的Page Rank算法和基于语义的主题相关度算法应用在Nutch排序算法中。实验结果表明:改进的排序算法使得Nutch的搜索结果排序准确率和首页命中率都有了明显提升。
【作者单位】: 武警七台河支队;武警杭州士官学院;
【关键词】: 网页排序算法 Nutch PageRank 语义相似度
【分类号】:TP393.092
【正文快照】: 1引言随着互联网的快速发展,互联网平台上的数据呈现出指数增长的趋势,人们对于搜索引擎的依赖性日益显示出来。如何更快更准确的检索网络中的海量信息,并将人们最需要的信息优先返回给用户,成了国内外专家研究的热点。Nutch作为网络爬虫和Lucene索引器的结合,功能强大。但Nut
【共引文献】
中国期刊全文数据库 前1条
1 胡维华;曹奇峰;;基于Nutch的页面排序算法研究[J];杭州电子科技大学学报;2013年06期
中国硕士学位论文全文数据库 前2条
1 曹奇峰;基于Nutch的食品安全信息垂直搜索引擎研究[D];杭州电子科技大学;2014年
2 杜雷;垂直搜索引擎网络爬虫的研究与设计[D];北京邮电大学;2015年
【二级参考文献】
中国期刊全文数据库 前3条
1 李稚楹;杨武;谢治军;;PageRank算法研究综述[J];计算机科学;2011年S1期
2 姚文琳;刘文;;一种基于本体的PageRank算法的改进策略[J];计算机工程;2009年06期
3 潘涛;梁正友;;Nutch中网页排序效果的改进方法[J];计算机工程;2010年13期
【相似文献】
中国期刊全文数据库 前10条
1 卢敏;黄亚楼;谢茂强;王扬;刘杰;廖振;;代价敏感的列表排序算法[J];计算机研究与发展;2012年08期
2 张正铀;;散列排序算法[J];广西科学院学报;1982年01期
3 全惠云;;基于矩阵分裂法的一类异步N&行排序算法[J];计算技术与自动化;1991年01期
4 董德林;两个高效排序算法的APPLESOFT BASIC程序[J];丽水师专学报;1992年S1期
5 王晓东;最优堆排序算法[J];小型微型计算机系统;2000年05期
6 吴江,张德同;二次分“档”链接排序算法分析[J];计算机研究与发展;2001年08期
7 李德启,王雄;一种新型快速的排序算法[J];计算机工程;2001年03期
8 赵忠孝;一种新的散列排序算法[J];电脑开发与应用;2001年03期
9 许善祥,朱学东,邵敬春;选择排序算法的改进[J];佳木斯大学学报(自然科学版);2001年04期
10 王红梅,朱洪秀,郑虹;一种改进的起泡排序算法及其性能分析[J];延边大学学报(自然科学版);2001年04期
中国重要会议论文全文数据库 前10条
1 周晓方;金志权;;寻找最佳分布式排序算法[A];第九届全国数据库学术会议论文集(上)[C];1990年
2 张艳秋;李建中;;一种基于蛇型磁带的排序算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
3 刘春阳;叶君峰;母海龙;陆秋霞;陈沧;高莺;;一种商品标题主题词的重要性排序算法[A];第五届全国信息检索学术会议论文集[C];2009年
4 王少帅;汤庆新;姚路;;并行独立集排序算法的改进与实现[A];第十六届全国青年通信学术会议论文集(上)[C];2011年
5 于芳;王大玲;于戈;陈冬玲;鲍玉斌;;面向用户的排序算法研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
6 闫泼;马军;陈竹敏;;面向主题的网页排序算法研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 吴志彬;陈义华;;ANP中超矩阵排序算法研究[A];2006中国控制与决策学术年会论文集[C];2006年
9 陈丛丛;石冰;陈健;;面向主题的查询相关网页排序算法[A];第三届中国智能计算大会论文集[C];2009年
10 齐曼;张珩;;实时视觉仿真中帧连贯性应用[A];'2000系统仿真技术及其应用学术交流会论文集[C];2000年
中国重要报纸全文数据库 前1条
1 广东 黄陀;基本算法简介(三)[N];电脑报;2001年
中国博士学位论文全文数据库 前3条
1 赵立军;基于归并的高效排序算法的研究[D];中国科学院研究生院(计算技术研究所);1998年
2 崔筠;无向基因组的移位排序算法[D];山东大学;2006年
3 郝凡昌;有向基因组复合操作重组排序算法研究[D];山东大学;2011年
中国硕士学位论文全文数据库 前10条
1 徐林龙;基于商品特征属性的排序算法研究[D];西南交通大学;2015年
2 王靖;数据库管理系统中高能效排序算法[D];浙江工业大学;2012年
3 尹晓;基因组移位排序算法的改进和评测[D];山东大学;2006年
4 黄兴;比特位拆分索引排序算法研究[D];清华大学;2007年
5 Mushtaq AbdulMutalib Hasson;一种论文时间与引用兼顾的科研论文排序算法[D];华中科技大学;2012年
6 刘声田;基于第一降序小队翻转排序算法的设计与实现[D];山东大学;2006年
7 曹臻;基于粗糙集的粒度排序算法[D];上海海事大学;2007年
8 侯红梅;图像搜索重排序算法研究[D];山东大学;2014年
9 徐艳霞;面向数学搜索的排序算法研究[D];兰州大学;2012年
10 张建英;稀疏正则化最小二乘排序算法[D];湖北大学;2011年
,本文编号:733471
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/733471.html