基于Web结构挖掘的搜索引擎作弊检测方法
本文选题:Web结构挖掘 + 搜索引擎作弊 ; 参考:《计算机应用》2004年10期
【摘要】:搜索引擎作弊行为从搜索引擎优化中演变而来,却对网络发展带来负面影响。通过构造站内站外精简模型用于判断几类作弊行为,得出PageRank改进算法中惩罚因子的公式和其中三个函数的特征,展望了搜索引擎作弊检测方法的发展前景。
[Abstract]:Search engine cheating evolved from search engine optimization, but it has a negative impact on the development of network. By constructing a simplified model of the station inside and outside the station to judge several kinds of cheating behavior, the formula of penalty factor and the characteristics of three functions in the improved PageRank algorithm are obtained, and the development prospect of the cheating detection method of search engine is prospected.
【作者单位】: 暨南大学计算机科学系 暨南大学网络中心 暨南大学计算机科学系
【基金】:广东省科技计划项目(2003C101037) 广东省自然科学基金重点项目(010421)
【分类号】:TP393.07
【共引文献】
相关期刊论文 前10条
1 王一蕾,林世平;基于Web页面链接结构的挖掘算法[J];福州大学学报(自然科学版);2004年04期
2 王艳辉,吴斌,王柏;电信社群网络静态几何性质分析研究[J];复杂系统与复杂性科学;2005年02期
3 邱均平,张洋;网络信息计量学综述[J];高校图书馆工作;2005年01期
4 王柏;吴巍;徐超群;吴斌;;复杂网络可视化研究综述[J];计算机科学;2007年04期
5 王凤霞,张景,常晓;电子教务门户研究与设计[J];计算机工程;2005年08期
6 高琰;谷士文;唐t;;基于链接分析的Web社区发现技术的研究[J];计算机应用研究;2006年07期
7 李向伟;曹博;;时间参数在HITS算法中的应用及改进[J];兰州工业高等专科学校学报;2006年02期
8 吴春旭,郭磊;Web结构挖掘的PageRank算法改进[J];情报杂志;2005年10期
9 王艳;张帆;杨炳儒;;基于Web挖掘的数字图书馆个性化技术研究[J];情报杂志;2007年01期
10 刘栋;刘希玉;郝婷婷;;基于PageRank和HITS的Web结构挖掘算法研究[J];山东科学;2006年04期
相关会议论文 前2条
1 杨宇航;赵铁军;郑德权;于浩;;基于链接分析的重要Blog信息源发现[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 张冉;卡米力毛依丁;;基于论文参考文献引用分析的专业文献查询库[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
相关博士学位论文 前6条
1 董宝力;Web制造资源的语义发现关键技术研究[D];浙江大学;2007年
2 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
3 高琰;基于多特征的Web社区发现关键技术研究[D];中南大学;2007年
4 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
5 乐小虬;非结构化网络空间信息智能搜索与服务研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 邓波;分布式序敏感查询处理关键技术研究[D];国防科学技术大学;2006年
相关硕士学位论文 前10条
1 佟秀杰;全国信访信息系统督察督办及分析预测子系统的设计与实现[D];吉林大学;2007年
2 刘菁菁;基于结构和主题的Web信息检索研究[D];大连理工大学;2007年
3 周炳;基于K-L变换的权威页面挖掘的算法[D];华中科技大学;2006年
4 丁妮;Web应用安全研究[D];南京信息工程大学;2007年
5 徐小磊;用户浏览模式与页面推荐的研究[D];南京理工大学;2007年
6 胡发连;基于概念短语的科技文献知识管理系统的研究与设计[D];中南大学;2007年
7 药成刚;基于链接结构的中文网页排序算法研究[D];哈尔滨工业大学;2006年
8 张战胜;复杂网络特征分析及其在电信客户流失分析中的应用[D];北京邮电大学;2007年
9 夏斌;Web结构挖掘中HITS算法的优化与实现[D];河南大学;2007年
10 王凤霞;研究生电子教务信息门户研究与开发[D];西安理工大学;2004年
【相似文献】
相关期刊论文 前10条
1 王奇,宋国新,邵志清;信息检索中基于链接的网页排序算法[J];华东理工大学学报;2000年05期
2 刘山,龚涛;基于Web结构数据挖掘技术的数学方法[J];中国民航学院学报;2001年06期
3 叶允明,于水,马范援,宋晖,张岭;分布式Web Crawler的研究:结构、算法和策略[J];电子学报;2002年S1期
4 刘山,刘峨;基于Web结构数据挖掘技术的数学方法[J];计算机工程;2002年07期
5 张海涛,董洲;搜索引擎Google的检索功能及PageRank技术分析[J];情报科学;2002年08期
6 阎放,张海涛,朱宏谊;GOOGLE搜索引擎PageRank技术的优化[J];情报科学;2002年12期
7 宋聚平,王永成,滕伟,许欢庆;搜索引擎中Robot搜索算法的优化[J];情报学报;2002年02期
8 曹军;Google的PageRank技术剖析[J];情报杂志;2002年10期
9 李凯,赫枫龄,左万利;PageRank-Pro——一种改进的网页排序算法[J];吉林大学学报(理学版);2003年02期
10 李盛韬,赵章界,余智华;基于主题的Web信息采集系统的设计与实现[J];计算机工程;2003年17期
相关会议论文 前4条
1 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
3 冯迪;李晋宏;曹原;;基于网页的数据挖掘研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
4 刘强国;左志宏;董祥千;;基于WEB超链接分析算法的研究综述[A];四川省通信学会2006年学术年会论文集(二)[C];2006年
相关重要报纸文章 前7条
1 北京 窦芳芳;给IE加上Google搜索工具条[N];电脑报;2001年
2 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;实验与实用系统[N];计算机世界;2003年
3 飘零雪;内嵌浏览器插件,Google搜索直达[N];中国电脑教育报;2004年
4 本报记者 王翌;Google的左手[N];计算机世界;2004年
5 文/大海;微软亚研院“微妙转向”[N];计算机世界;2004年
6 本报记者 陈宜飚;Google上市:搜索引擎混战从线上开始[N];21世纪经济报道;2004年
7 本报记者 马文方;匠心在胸[N];中国计算机报;2008年
相关硕士学位论文 前10条
1 于爱军;NERMS中基于Internet的搜索引擎研究与实现[D];吉林大学;2004年
2 吴东华;Web信息获取技术研究[D];南京理工大学;2004年
3 戚华春;互联网络信息挖掘算法的研究[D];浙江工业大学;2005年
4 赵立刚;搜索引擎的研究与设计[D];吉林大学;2005年
5 张玲;智能信息采集搜索策略研究[D];湖南大学;2004年
6 李世明;专业搜索引擎中信息过滤的研究与实现[D];北京化工大学;2005年
7 张巍;基于PageRank算法的搜索引擎优化策略研究[D];四川大学;2005年
8 胡小睿;基于Web挖掘的搜索引擎技术研究[D];武汉大学;2005年
9 王小根;基于移动Agent的网格资源发现和调度的研究[D];江南大学;2005年
10 谢超;支持查询剪裁的搜索引擎数据缓冲策略[D];浙江大学;2006年
,本文编号:2002396
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2002396.html