当前位置:主页 > 科技论文 > 搜索引擎论文 >

搜索引擎应对垃圾网页的技术研究

发布时间:2018-01-04 20:06

  本文关键词:搜索引擎应对垃圾网页的技术研究 出处:《电脑知识与技术》2015年26期  论文类型:期刊论文


  更多相关文章: 搜索引擎 垃圾网页 网页作弊方式 垃圾网页识别


【摘要】:介绍了常见的垃圾网页作弊方式。并对垃圾网页的识别方式进行了详细分析,包括基于网页内容的垃圾网页识别技术、基于链接结构来识别垃圾网页的Trust Rank算法以及目前比较流行的用于垃圾页面识别的机器学习分类法。其中采用Trust Rank算法与机器学习分类法来识别垃圾网页具有一定的通用性且具有与作弊方式无关的特性。最后提出了一些基于用户行为模式来识别垃圾网页的新思路。
[Abstract]:This paper introduces the common ways of spam web page cheating, and analyzes the identification method of garbage web page in detail, including the technology of garbage page recognition based on web content. The Trust Rank algorithm based on link structure to identify spam pages and the machine learning taxonomy for garbage page recognition are popular. Trust is used among them. The Rank algorithm and the machine learning classification method are used to identify spam pages, which are universal and independent of cheating methods. Finally, some new ideas based on user behavior patterns are proposed to identify spam pages.
【作者单位】: 四川大学锦城学院计算机科学与软件工程系;
【分类号】:TP393.092
【正文快照】: 通常我们找到一个网站的方式除了少量知名网站可以直接在浏览器地址栏中直接书写URL之外,还有一部分可能是通过导航网址或者收藏夹来访问,剩下的大部分网站实际上是通过搜索引擎找到的。另外,根据2006年所发布的《搜索引擎用户行为报告》[1]可知,大约88%的搜索引擎使用者只会

【参考文献】

相关期刊论文 前2条

1 杨凡;朱焱;唐寿洪;;基于免疫克隆选择算法的垃圾网页检测[J];计算机应用与软件;2015年06期

2 贾志洋;李伟伟;高炜;夏幼明;;基于支持向量机的搜索引擎垃圾网页检测研究[J];云南民族大学学报(自然科学版);2011年03期

【共引文献】

相关期刊论文 前2条

1 贾志洋;夏幼明;高炜;王勇刚;;搜索引擎垃圾网页检测模型研究[J];重庆文理学院学报(自然科学版);2011年05期

2 刘虎;罗斌;吴晟;侯明;;改进的遗传算法在SVM参数优化中的应用[J];云南师范大学学报(自然科学版);2012年04期

相关硕士学位论文 前2条

1 宋艳艳;基于内容分类的垃圾短信拦截系统的研究[D];哈尔滨理工大学;2012年

2 宋海霞;融合内容及行为的虚假评论检测方法研究[D];昆明理工大学;2014年

【二级参考文献】

相关期刊论文 前6条

1 王利刚;赵政文;赵鑫鑫;;搜索引擎中的反SEO作弊研究[J];计算机应用研究;2009年06期

2 贾志洋;李伟伟;张海燕;;基于内容的搜索引擎垃圾网页检测[J];计算机应用与软件;2009年11期

3 周茜,赵明生,扈e,

本文编号:1379883


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1379883.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8f709***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com