面向垂直搜索引擎的主题提取算法
[Abstract]:In order to solve the problem of topic drift caused by the HITS algorithm assigning equal weights to all links, an improved HITS algorithm based on calculating link value and semantic topic similarity of Web pages is proposed, which highlights the difference of link importance. The experimental results show that the algorithm improves the topic correlation by 13% and 42%, avoids the topic drift problem, enhances the accuracy of collecting information, and has important theoretical and practical value for the research of vertical search engine.
【作者单位】: 西安理工大学计算机科学与工程学院;
【基金】:陕西省自然科学基础研究计划基金资助项目(2007F52)
【分类号】:TP391.3
【相似文献】
相关期刊论文 前10条
1 刘博卿;;基于军事工程兵的垂直搜索引擎研究[J];科技创新导报;2011年18期
2 张旭;;构建基于本地服务的垂直搜索引擎[J];才智;2011年18期
3 王晓春;李慧;;面向教育的垂直搜索引擎框架及其应用[J];电化教育研究;2011年09期
4 梁永演;;浅析搜索引擎的超链接分析排序算法[J];晋图学刊;2011年04期
5 施Oz;王恒山;肖仰华;丁卫平;;面向主题的垂直搜索引擎系统的研究与实现[J];微电子学与计算机;2011年07期
6 郭锐;;新型垂直育儿搜索引擎“智能育儿通”的研究与实现[J];天津科技;2011年03期
7 陈国华;汤庸;彭泽武;李建国;;基于学术社区的学术搜索引擎设计[J];计算机科学;2011年08期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前3条
1 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 林欢欢;王文杰;史忠植;;移动环境下垂直搜索引擎[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 王旭;杜军平;;质检总局互联网舆情监控系统中聚焦爬虫的研究[A];中国电子学会第十七届信息论学术年会论文集[C];2010年
相关重要报纸文章 前2条
1 电子工业出版社 董娅 工业和信息化部电子科学技术情报研究所 周峻松;用开源软件建垂直搜索引擎[N];计算机世界;2010年
2 本报记者 陈嘉佳;网络营销创新航空公司寻找的“冬季牧草”[N];中国民航报;2009年
相关博士学位论文 前3条
1 王晔;垂直搜索引擎若干问题研究[D];复旦大学;2011年
2 胡宜敏;农业垂直搜索引擎语义化若干问题的研究与实现[D];中国科学技术大学;2012年
3 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
相关硕士学位论文 前10条
1 李春燕;企业信息垂直搜索引擎的研究与实现[D];中国地质大学(北京);2010年
2 齐鹏;垂直搜索引擎分类索引系统的设计与实现[D];大连海事大学;2010年
3 张楠;面向汽车主题的垂直搜索引擎研究与实现[D];西南交通大学;2010年
4 陈向东;宠物用品垂直搜索引擎研究与设计[D];西北农林科技大学;2010年
5 周佳庆;实时垂直搜索引擎数据抓取调度研究[D];浙江大学;2010年
6 华大年;手机产品信息垂直搜索引擎系统设计与开发[D];武汉理工大学;2011年
7 薛萍;基于教育领域的垂直搜索引擎的研究与实现[D];天津师范大学;2011年
8 冯效栋;垂直搜索引擎技术在网络舆情巡控中的研究与应用[D];中国海洋大学;2010年
9 张赢;个性化多媒体资源垂直搜索引擎技术研究[D];华东交通大学;2009年
10 李海升;垂直搜索引擎的研究与实现[D];西安电子科技大学;2009年
,本文编号:2205108
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2205108.html