基于链接分析的网络搜索排名的反作弊研究
本文选题:排序算法 切入点:链接分析 出处:《系统管理学报》2013年01期 论文类型:期刊论文
【摘要】:针对网络上大量充斥的搜索排名作弊行为,提出基于链接分析并具备反作弊功能的网络排名算法。在初始黑名单条件下,根据页面之间的链接关系,引入作弊倾向性和关联性2个概念,来衡量一个页面作弊的可能性。在此基础上,构造了惩罚因子,并对PageRank的值进行修正,实现新的排名顺序。该算法能够将权威性较高、作弊可能性较低的页面呈现给用户,提高用户的搜索效率。以3 537 379个网页8 456 740条链接为素材,对算法的反作弊性能进行实验。结果显示,与PageRank和TrustRank算法相比,该算法的反作弊性能有了明显地提高。
[Abstract]:In view of the widespread cheating in search ranking on the network, this paper puts forward a network ranking algorithm based on link analysis and anti-cheating function. Under the condition of initial blacklist, according to the link relationship between pages, Two concepts of cheating tendency and relevance are introduced to measure the possibility of cheating on a page. On this basis, a penalty factor is constructed, and the value of PageRank is modified to achieve a new ranking order. Pages with low possibility of cheating are presented to users, and the search efficiency of users is improved. Taking 8,456,740 links of 3 537,379 web pages as material, the anti-cheating performance of the algorithm is tested. The results show that the algorithm is compared with PageRank and TrustRank algorithms. The anti-cheating performance of this algorithm has been improved obviously.
【作者单位】: 同济大学经济与管理学院;
【基金】:国家自然科学基金资助项目(70971099) 教育部人文社会科学资助项目(05JC870013) 上海市重点学科建设项目(B310)
【分类号】:TP393.092
【相似文献】
中国期刊全文数据库 前10条
1 何拥军;龚发根;;基于用户辅助估计的相关网页搜索聚类[J];计算机技术与发展;2011年07期
2 杨石山;孙建军;;中美高校图书馆网站链接结构比较研究[J];情报科学;2011年07期
3 杨超;李杰;李浩宇;;基于PageRank的页面排序算法研究[J];电脑编程技巧与维护;2011年16期
4 朱怡安;雷万保;;基于服务关联模型的服务排序算法——ServiceRank[J];电子科技大学学报;2011年04期
5 詹圣君;邵雄凯;刘建舟;;一种考虑用户行为的改进N—PageRank算法[J];计算机技术与发展;2011年08期
6 张敏;李锋;;PageRank算法研究[J];微计算机信息;2011年08期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 吴炜;梁昆;李瑞轩;辜希武;卢正鼎;;一种基于主题相关度的网页排序算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
2 宋丹;林鸿飞;杨志豪;;一种利用链接分析的Web话题跟踪方法[A];第三届学生计算语言学研讨会论文集[C];2006年
3 邹纲;孟遥;于浩;西野文人;;一种基于网站主页信息建立公司名称知识库的方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 刘凯鹏;方滨兴;;一种基于社会性标注的网页排序算法[A];第五届全国信息检索学术会议论文集[C];2009年
5 葛先军;李志勇;宋巍巍;;基于网页恶意脚本链接分析的木马检测技术[A];第五届中国测试学术会议论文集[C];2008年
6 陈丛丛;石冰;陈健;;面向主题的查询相关网页排序算法[A];第三届中国智能计算大会论文集[C];2009年
7 刘悦;王斌;杨志峰;张鑫;;Web关键资源发现中的链接分析技术[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 王玉婷;杜亚军;涂腾涛;;基于Web链接的主题爬行虫初始URL的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 孔维泽;刘奕群;张敏;马少平;;问答社区中回答质量的评价方法研究[A];第六届全国信息检索学术会议论文集[C];2010年
10 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
中国重要报纸全文数据库 前4条
1 钱鹏;网尽Web页中的好东东[N];电脑报;2004年
2 百度网络技术公司 刘建国;从中国人网站看搜索引擎的ASP服务[N];中国计算机报;2000年
3 Websense中国区高级技术顾问 李智明;反垃圾邮件成为网络安全重要一环[N];中国计算机报;2008年
4 赛迪网 方刚;不只是网站才垂直[N];中国计算机报;2000年
中国博士学位论文全文数据库 前6条
1 江开忠;上下文感知的Web搜索关键技术研究[D];华东师范大学;2008年
2 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
3 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
4 吴刚;RDF图数据管理的关键技术研究[D];清华大学;2008年
5 刘玉婷;网页排序中的随机模型及算法[D];北京交通大学;2009年
6 谢海涛;移动个性化信息服务系统的进化机制研究[D];北京邮电大学;2012年
中国硕士学位论文全文数据库 前10条
1 高文梁;改进的基于历史信息分析的网页排序算法[D];大连理工大学;2009年
2 彭聪;一种在移动网络环境下的网页排序算法的研究[D];湖南大学;2010年
3 陈辉;金融领域的博客信息采集与排序算法研究[D];哈尔滨工业大学;2009年
4 岳增慧;高校图书馆网络空间链接特征研究[D];曲阜师范大学;2011年
5 秦辉;基于重要性传递模型的Web页面静态排序算法[D];大连理工大学;2007年
6 郑州斌;基于内容与链接分析的主题相关网站排序算法的研究[D];浙江大学;2008年
7 张士军;基于随机游走的网页协同排序算法研究[D];大连理工大学;2010年
8 王昭华;基于链接分析的Blog网页排序算法的研究[D];东北大学;2009年
9 金奇;基于链接分析的中国体育类网站评估[D];复旦大学;2012年
10 范鑫鑫;基于页面相似度的链接分析算法研究[D];大连理工大学;2008年
,本文编号:1620707
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1620707.html