当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于网页内容评价和Web图的启发式垂直搜索策略的设计

发布时间:2018-05-04 10:43

  本文选题:垂直搜索引擎 + 网页下载 ; 参考:《情报理论与实践》2009年09期


【摘要】:针对传统的基于Web图的垂直搜索策略Authorities and Hubs,提出了一种融合了网页内容评价和Web图的启发式垂直搜索策略,此外,引入向量空间模型进行针对网页内容的主题相关度判断,进一步提高主题网页下载的准确率。实验表明,文中算法有效地提高了主题网页的聚合程度,且随着网页下载数量的增加,垂直搜索引擎的准确率逐渐递增,并在下载网页达到一定数量后,准确率趋于稳定,算法具有较好的鲁棒性,可以应用到相关垂直搜索引擎系统中。
[Abstract]:Aiming at the traditional vertical search strategy based on Web graph, Authorities and Hubs, proposes a heuristic vertical search strategy which combines the evaluation of web content with Web graph. In addition, vector space model is introduced to judge the relevance of web content. Further improve the theme page download accuracy. Experiments show that the algorithm can effectively improve the aggregation degree of topic pages, and with the increase of the number of pages downloaded, the accuracy of vertical search engines increases gradually, and the accuracy rate tends to be stable after downloading a certain number of pages. The algorithm is robust and can be applied to vertical search engine systems.
【作者单位】: 华东交通大学信息工程学院;
【基金】:江西省教育厅基金项目(赣教技字[2006]177号) 华东交通大学校立基金(项目编号:08xx05)资助的成果之一
【分类号】:TP391.3

【参考文献】

相关期刊论文 前1条

1 张岭,叶允明,宋晖,于水,马范援;一种高性能分布式Web Crawler的设计与实现[J];上海交通大学学报;2004年01期

【共引文献】

相关期刊论文 前10条

1 陈治昂;张毅;李大学;;基于Web智能的网络广告监测器研究与设计[J];重庆邮电大学学报(自然科学版);2009年01期

2 丛荣华;;网络教育中的数据收集技术[J];长春师范学院学报;2006年10期

3 尚冬娟;张敏;;信息过滤系统中的混合式过滤算法[J];重庆工学院学报(自然科学版);2008年01期

4 刘双印;徐龙琴;沈玉利;;改进小生境遗传算法在元搜索引擎调度优化中的研究[J];重庆师范大学学报(自然科学版);2008年03期

5 张玉连;张敏;张波;;一种扩展的向量空间模型-隐含语义索引模型研究[J];燕山大学学报;2006年01期

6 景虹;詹海生;;基于Web Services的个性化学习资源获取[J];中国远程教育;2006年08期

7 孟祥增;;基于内容的图像网络教学资源检索研究[J];中国远程教育;2008年04期

8 杨如祥;曾献辉;;一种基于网页特征提取的网站全文搜索系统的设计与实现[J];东华大学学报(自然科学版);2007年05期

9 孟祥增;;多媒体网络教学资源的内容特征提取与搜索研究[J];电化教育研究;2007年12期

10 武晓娟;;基于网站的搜索引擎研究[J];大连海事大学学报;2008年S1期

相关会议论文 前5条

1 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

2 王虎;王潜平;;对整词二分自动分词机制的改进[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年

3 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;基于Web的民文信息检索中维、哈、柯文关键词的预处理[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年

4 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;维、哈、柯全文搜索引擎中查询处理研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

5 张乃岳;张学燕;;基于个体词语相似度的定制化动态信息检索[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

相关博士学位论文 前5条

1 文坤梅;基于本体知识库推理的语义搜索研究[D];华中科技大学;2007年

2 陈竹敏;面向垂直搜索引擎的主题爬行技术研究[D];山东大学;2008年

3 王辉;基于质心具有增量性质的主题爬行[D];吉林大学;2007年

4 南凯;面向关系型数据共享的数据网格中间件研究[D];中国科学院研究生院(计算技术研究所);2006年

5 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年

相关硕士学位论文 前10条

1 何霞;基于Lucene的电力企业信息全文搜索系统的设计和实现[D];华北电力大学(北京);2009年

2 赵静;基于PageRank的MBA教育资源搜索引擎研究[D];大连海事大学;2009年

3 原佳丽;网络多媒体教育资源数据库检索研究[D];山东师范大学;2009年

4 王颖;中文局域网搜索引擎设计与实现[D];电子科技大学;2009年

5 杨帅;搜索引擎中Crawler的设计、实现与扩展优化[D];电子科技大学;2009年

6 王涛;基于HTML标记的主题爬行器的设计与实现[D];电子科技大学;2009年

7 严硕;短信舆情信息处理平台[D];北京交通大学;2009年

8 陈哲;面向垂直搜索引擎的网页抓取器的设计和实现[D];中国海洋大学;2009年

9 王玉辉;垂直搜索引擎关键技术研究及应用[D];华北电力大学(河北);2009年

10 郑萍;军用文献检索系统的设计与实现[D];复旦大学;2009年

【相似文献】

相关期刊论文 前10条

1 卢敏;;垂直搜索——我专故我在[J];软件世界;2006年23期

2 顾鹏尧;“大话搜索引擎”[J];信息技术教育;2003年04期

3 王左利;;搜索的花样年华[J];中国教育网络;2007年06期

4 杨坚争;李朝平;;垂直搜索引擎及其应用[J];电子商务;2006年10期

5 肖冬梅;垂直搜索引擎研究[J];图书馆学研究;2003年02期

6 ;垂直搜索互联网搜索业的新军[J];数字通信世界;2006年12期

7 陈新颜;垂直搜索引擎辨析[J];现代情报;2004年09期

8 田野;垂直搜索火热为哪般[J];中国计算机用户;2005年37期

9 胡文胜;;垂直搜索助号码百事通与商务领航[J];每周电脑报;2006年32期

10 顾鹏尧;;让搜索引擎更好地服务于教育教学[J];科学24小时;2003年Z1期

相关会议论文 前10条

1 王典乐;任照峰;牟灵泉;;基于并行计算和网络应用的暖通空调CAD搜索策略应用探讨[A];全国暖通空调制冷2002年学术年会论文集[C];2002年

2 彭俊杰;卢正鼎;李瑞轩;;一种改进的非结构化P2P网络搜索方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年

3 罗凡;彭秀增;申春;李肃义;;MySQL中InnoDB引擎索引树的搜索策略[A];2006年全国理论计算机科学学术年会论文集[C];2006年

4 熊凌;;计算机视觉中的图像匹配综述[A];12省区市机械工程学会2006年学术年会湖北省论文集[C];2006年

5 王典乐;任照峰;牟灵泉;;基于并行计算和网络应用的暖通空调CAD搜索策略应用探讨[A];山东建筑学会成立50周年优秀论文集[C];2003年

6 王仲君;刘珊;;武汉市公交停靠站点加权网络的搜索策略[A];2006全国复杂网络学术会议论文集[C];2006年

7 林海霞;原福永;陈金森;;主题网络蜘蛛搜索策略贪婪性解决方法[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

8 黄可为;赵雁南;王家^,

本文编号:1842727


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1842727.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0c065***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com