当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于限制标记传播的搜索引擎反链接作弊方法

发布时间:2019-07-18 08:02
【摘要】:当今网络环境下,搜索引擎是人们获取信息的一条主要途径。然而搜索引擎的发展受到了搜索引擎作弊行为的挑战。搜索引擎作弊行为定义为采用一些刻意设计的机制来提高网站或网页在搜索引擎结果中排名的行为。进行搜索引擎作弊行为的网站就叫做作弊网站。作弊者为了达到他们的目的,会仔细研究搜索引擎的排名算法,找出排名依据的主要因素加以利用。所以,搜索引擎作弊是搜索引擎面对的最主要挑战,如果不采取措施,搜索引擎的结果会被严重干扰,导致许多人不再信任搜索引擎。由于搜索引擎作弊技术在不断进化,其方法也多种多样,再加上互联网数据的庞大性,这些因素都给反搜索引擎作弊工作带来了困难。从搜索引擎作弊出现至今,人们已经提出了多种多样的应对不同类型搜索引擎作弊的策略。 本文首先分类说明了了常见的搜索引擎作弊方法,包括基于内容的、基于链接的和基于隐藏页面的。之后详细介绍了已有的几种代表性的搜索引擎反作弊算法。同时提出了已有的主流反作弊方法,即基于标记传播的方法的缺陷。本文进一步提出了限制标记传播的反作弊方法,先使用随机游走获取到作弊社区群,然后根据作弊社区群的信息对信任值标记和作弊值标记在网络中的传播进行限制,在一定程度上弥补了已有算法的缺陷。 通过在多个真实数据集上的实验,证明了限制标记传播的算法相比已有的标记传播算法效果的提升,改进了搜索引擎反作弊的质量。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 何兆毅;;怎样让科技期刊在百度和谷歌搜索引擎更容易搜到[J];编辑之友;2011年01期

2 涂强;;登录奇兵[J];电脑界(应用文萃);2000年10期

3 师维军,乌买尔江,徐利民;如何有效地在互联网上获取棉花信息[J];江西棉花;2003年06期

4 陈诗;;企业网络营销误区[J];中国西部科技;2006年08期

5 听风就是雨;搜索引擎DIM——增值你的网站服务[J];电子计算机与外部设备;2001年01期

6 靳美;搜索引擎大放送[J];电脑;2000年08期

7 陈冰;;饿狼一样的网站提交工具——“提交饿狼”[J];科学之友;2000年07期

8 封剑待封喉;吸星大法“搜”天下 笑傲网络任我行——搜索引擎绝对专题[J];网络与信息;2003年07期

9 潘颖;英文网站的搜索引擎优化及其海外宣传策略[J];计算机系统应用;2004年10期

10 张继刚;搜索引擎使用技巧[J];网络与信息;1999年09期

相关会议论文 前10条

1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

2 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

3 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

4 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

5 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

6 王灿辉;张敏;马少平;;Web作弊与反作弊技术综述[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年

7 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

8 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

9 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年

10 石淑华;;利用搜索引擎检索网络生物信息的方法与技巧[A];山西省科学技术情报学会学术年会论文集[C];2004年

相关重要报纸文章 前10条

1 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年

2 本报记者  陈芳丹;在大海中捞针[N];计算机世界;2006年

3 博文邋译;你的隐私 搜索引擎知道[N];计算机世界;2007年

4 孙t;迷失的搜索引擎[N];第一财经日报;2007年

5 刘文君;搜索引擎也在寻求创新[N];大众科技报;2007年

6 麻玉秀;搜索引擎企业将“避风港”变成“加速器”[N];中国经营报;2006年

7 本报记者 胡钰;携程状告“去哪儿” 再设搜索雷区[N];华夏时报;2008年

8 记者 胡红军 王宇寰 冯欢 本报记者 秦海波;搜索引擎市场将超20亿元[N];经济日报;2005年

9 周广奋;CNNIC:2007年6成网民每天用搜索引擎[N];中国国门时报;2007年

10 本报记者 符王润 通讯员 湛立;广东企业告倒“谷歌”[N];广东科技报;2009年

相关博士学位论文 前10条

1 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年

2 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

3 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

4 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

5 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

6 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

7 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

9 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年

10 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年

相关硕士学位论文 前10条

1 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年

2 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年

3 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年

4 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年

5 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年

6 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年

7 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年

8 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年

9 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年

10 田生伟;基于涉农词典的搜索引擎的研究与实践[D];新疆大学;2004年



本文编号:2515746

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2515746.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户12804***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com