加速评估算法:一种提高Web结构挖掘质量的新方法
发布时间:2018-05-13 18:50
本文选题:Web结构挖掘 + PageRank ; 参考:《计算机研究与发展》2004年01期
【摘要】:利用Web结构挖掘可以找到Web上的高质量网页 ,它大大地提高了搜索引擎的检索精度 目前的Web结构挖掘算法是通过统计链接到每个页面的超链接的数量和源结点的质量对页面进行评估 ,基于统计链接数目的算法存在一个严重缺陷 :页面评价两极分化 一些传统的高质量页面经常出现在Web检索结果的前面 ,而Web上新加入的高质量页面很难被用户找到 提出了加速评估算法以克服现有Web超链接分析中的不足 ,并通过搜索引擎平台对算法进行了测试和验证
[Abstract]:High quality web pages on Web can be found by using Web structure mining. It greatly improves the retrieval accuracy of search engines. The current Web structure mining algorithm evaluates the pages by counting the number of hyperlinks to each page and the quality of the source nodes. The algorithm based on the number of statistical links has a serious drawback: page evaluation polarizes some traditional high-quality pages that often appear ahead of Web retrieval results. However, it is difficult for users to find the new high quality pages on Web to overcome the shortcomings of the existing Web hyperlink analysis, and test and verify the algorithm through the search engine platform.
【作者单位】: 上海交通大学计算机科学与工程系 上海交通大学计算机科学与工程系
【基金】:上海市基础研究重点基金项目 ( 0 2DJ14 0 45 )
【分类号】:TP393.09
【共引文献】
相关期刊论文 前3条
1 雷鸣,王建勇,赵江华,单松巍,陈葆珏;第三代搜索引擎与天网二期[J];北京大学学报(自然科学版);2001年05期
2 彭波;;大规模搜索引擎检索系统框架与实现要点[J];计算机工程与科学;2006年03期
3 苗长芬,冯伟华;面向主题Crawler的设计与实现[J];平原大学学报;2005年03期
相关博士学位论文 前1条
1 刘康苗;自适应网络信息获取服务技术研究[D];浙江大学;2008年
相关硕士学位论文 前10条
1 董志勇;Web信息检索中基于超链接的网页评估算法的研究[D];河海大学;2004年
2 戚华春;互联网络信息挖掘算法的研究[D];浙江工业大学;2005年
3 姜杰;专业搜索引擎分布式Robot设计研究[D];南京师范大学;2005年
4 陈洁惠;搜索引擎排序算法的研究[D];河海大学;2007年
5 邱正国;主题蜘蛛的研究及实现[D];南京师范大学;2007年
6 刘文琦;中文网页自动分类技术的研究与实现[D];哈尔滨工程大学;2007年
7 蔡建超;基于DRIS理论的新型网络搜索引擎设计[D];华中科技大学;2006年
8 刘沛e,
本文编号:1884377
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1884377.html