SHITS:一种基于超链接和内容的网页排序方法
[Abstract]:This paper reviews the current mainstream web page sorting algorithms used in large search engines, and improves the ARC algorithm. In this paper, a web page sorting algorithm based on hyperlink and content, SHITS (Similarity-HITS) algorithm, is proposed. Shits algorithm uses the web page content referenced by hyperlink instead of the anchor text used in ARC algorithm to evaluate the importance of the hyperlink. This improvement not only improves the ability of the algorithm to distinguish the importance of links, but also avoids the analysis of a large number of anchor text content. Compared with the related algorithms, the results show that the SHITS algorithm is superior to other algorithms in web page sorting accuracy. In addition, the SHITS algorithm has a better efficiency than the ARC algorithm, which is similar to the HITS algorithm.
【作者单位】: 中国科学技术大学电子工程与信息科学系 中国科学技术大学计算机科学技术系 中国科学技术大学计算机科学技术系
【基金】:国家“九七三”计划项目(2003CB17000)资助
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 潘大胜;黄小龙;;基于校园网的信息资源搜索引擎系统的设计[J];贵州工业大学学报(自然科学版);2008年05期
2 蒋建中;丁宝琼;吴琼;邱文武;;基于页面分块的网页排序算法:BHITS[J];计算机工程;2010年11期
3 胡骏;李星;;校园网信息资源搜索引擎的研究与实现[J];计算机工程与设计;2006年24期
4 张毅;张冬梅;;搜索引擎PageRank算法的比较与改进[J];科技创新导报;2008年21期
5 贾丽柯;;基于校园网的搜索引擎排序算法研究[J];商丘职业技术学院学报;2008年02期
6 郝金隆;王成良;;原创优先的搜索引擎排序算法[J];计算机工程;2008年18期
7 金祖旭;李敏波;;基于用户反馈的搜索引擎排名算法[J];计算机系统应用;2010年11期
8 韩红芳;陈其勇;;小世界网络在搜索引擎算法中的应用[J];天津农学院学报;2006年02期
9 陈恩红;李梁;;一种对象级搜索中的多查询合并算法[J];中国科学技术大学学报;2008年10期
10 蒋宗礼;李宪雷;徐学可;;基于主题Hub值的元搜索[J];北京工业大学学报;2009年03期
相关会议论文 前10条
1 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 李贺华;付鹤岗;;多Agent Web信息检索应用研究[A];2008年计算机应用技术交流会论文集[C];2008年
3 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
4 郭鸿志;陈清才;康永燕;王晓龙;;一种基于网站特征识别的搜索引擎排序算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 梁婷婷;张志强;谢晓芹;;搜索引擎评估算法综述[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
6 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
7 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
8 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
9 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
10 杨磊;束罡;牛振东;;基于引力模型的链接分析(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
相关重要报纸文章 前10条
1 王立群;搜索新生代[N];中国计算机报;2005年
2 李一鑫;搜索排名的红与黑[N];财经时报;2007年
3 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
4 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
5 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,还是门户[N];中国计算机报;2005年
6 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
7 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
8 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
9 本报记者 赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年
10 孙t;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年
相关博士学位论文 前10条
1 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年
2 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
3 刘玉婷;网页排序中的随机模型及算法[D];北京交通大学;2009年
4 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
5 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
6 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
7 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
8 曹欢欢;基于大规模搜索日志挖掘的上下文感知搜索研究[D];中国科学技术大学;2009年
9 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
10 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
相关硕士学位论文 前10条
1 程建;一种网页搜索引擎原型系统的设计与实现[D];北京邮电大学;2009年
2 李连江;个性化搜索引擎模型的研究与改进[D];哈尔滨工程大学;2008年
3 尹辉;基于Nutch的搜索系统的研究[D];电子科技大学;2008年
4 王军;中文搜索引擎的设计与实现[D];华中科技大学;2004年
5 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
6 苏国荣;校园网搜索引擎排序的去重方法研究[D];国防科学技术大学;2010年
7 刘青伟;搜索引擎中的Pagerank排序算法研究分析[D];电子科技大学;2010年
8 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
9 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年
10 徐永红;基于专题信息服务的智能搜索引擎技术研究[D];国防科学技术大学;2004年
,本文编号:2472916
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2472916.html