Web信息检索中主题精选算法的研究与改进
[Abstract]:Search engine is the most important Web information retrieval tool, but its effect is not satisfactory. The link analysis iteration of the topic selection algorithm based on Web link structure often converges to the closely interlaced region (TKC), which is not related to the query subject in the link graph which leads to the topic offset. The author's analysis of the classical theme selection algorithm (HITS) shows that the algorithm also provides unequal influence weights for different Web sites and fails to meet the multi-granularity information requirements of users. In this paper, based on the analysis of the topic selection algorithm, an improved algorithm g-HITScis is proposed, which is proved to be reasonable and effective.
【作者单位】: 河海大学计算机及信息工程学院 东南大学计算机科学与工程系 东南大学计算机科学与工程系
【基金】:国家自然科学基金项目(编号:60173036) 江苏省“十五”高科技项目(编号:BG2001013)资助
【分类号】:TP393.092
【相似文献】
相关期刊论文 前10条
1 张彬;蒋涛;徐雨明;;Web Spam技术研究综述(英文)[J];衡阳师范学院学报;2008年06期
2 何晓阳,吴强,吴治蓉;HITS算法与PageRank算法比较分析[J];情报杂志;2004年02期
3 郑煜;钱榕;;一个基于链接分析的相关度排序算法及其在专题搜索引擎中应用[J];计算机应用与软件;2007年07期
4 蒋卫星;金瓯;张彬;;Web搜索算法研究综述[J];计算机技术与发展;2007年04期
5 陈学进;;网络结构挖掘算法研究[J];计算机技术与发展;2009年05期
6 许卓明,曹潇,韩亚洪,董逸生;主题精选算法中Web邻域图的构造[J];计算机应用研究;2004年01期
7 陈定权;Web信息检索技术最新进展[J];现代图书情报技术;2002年02期
8 陈太洋;;我国大学图书馆网站链接的实证分析——以中国“211工程”高校为例[J];图书馆杂志;2007年03期
9 周涛;陈向东;;基于链接分析的网站评价[J];广西教育学院学报;2008年04期
10 刘彦祖;;Web of Science数据库中网络链接分析研究论文的定量分析[J];情报探索;2010年02期
相关会议论文 前10条
1 刘兵;胡学钢;;基于多链接分析的主题爬虫设计实现[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
2 宋丹;林鸿飞;杨志豪;;一种利用链接分析的Web话题跟踪方法[A];第三届学生计算语言学研讨会论文集[C];2006年
3 邹纲;孟遥;于浩;西野文人;;一种基于网站主页信息建立公司名称知识库的方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 刘悦;张刚;王斌;许洪波;;查询相关链接分析算法优化策略研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
6 吴炜;梁昆;李瑞轩;辜希武;卢正鼎;;一种基于主题相关度的网页排序算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
7 冯迪;李晋宏;曹原;;基于网页的数据挖掘研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
8 杨宇航;赵铁军;郑德权;于浩;;基于链接分析的重要Blog信息源发现[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 刘强国;左志宏;董祥千;;基于WEB超链接分析算法的研究综述[A];四川省通信学会2006年学术年会论文集(二)[C];2006年
10 葛先军;李志勇;宋巍巍;;基于网页恶意脚本链接分析的木马检测技术[A];第五届中国测试学术会议论文集[C];2008年
相关重要报纸文章 前10条
1 上海证券研究发展中心 张瑾;嘉实主题精选 股票调整积极[N];中国证券报;2007年
2 本报记者 马薪婷;明年一季度布局“先手”:跨年度投资主题[N];证券日报;2010年
3 本报记者 贾宝丽;搭乘国航 嘉实精选“喜从天降”[N];上海证券报;2006年
4 任瞳;嘉实主题精选VS南方稳健成长2号[N];中国证券报;2007年
5 旺赢;利用主题投资 分享A股盛宴[N];市场报;2006年
6 刘伟;嘉实主题精选基金获批发行[N];深圳商报;2006年
7 王影;嘉实主题精选基金获批发行[N];中国经济导报;2006年
8 证券时报记者 徐幸福;市场风向渐变 二线基金发威[N];证券时报;2006年
9 吴汀煌;利用主题投资分享A股“盛宴”[N];厦门日报;2006年
10 吴慧邋谢潞锦;窦玉明卸任嘉实主题精选基金经理引猜想[N];第一财经日报;2008年
相关博士学位论文 前10条
1 毛照f ;面向客户价值和精/敏战略的制造供应网络绩效评价研究[D];天津大学;2006年
2 段宇锋;网络链接分析与网站评价研究[D];武汉大学;2004年
3 褚武英;三种石首鱼紧密连锁的α-和β-珠蛋白基因的克隆及其顺式调控元件的分析[D];浙江大学;2006年
4 刘洪波;INTERNET中的信息网络提取分析及Rank相关研究[D];清华大学;2007年
5 江开忠;上下文感知的Web搜索关键技术研究[D];华东师范大学;2008年
6 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
7 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
8 吴刚;RDF图数据管理的关键技术研究[D];清华大学;2008年
9 徐秀娟;商务智能中的利润挖掘研究[D];吉林大学;2008年
10 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
相关硕士学位论文 前10条
1 韩亚洪;结合内容与链接分析搜索特定主题的权威Web信息源[D];河海大学;2003年
2 夏斌;Web结构挖掘中HITS算法的优化与实现[D];河南大学;2007年
3 郭坤银;基于页面分块和链接分析的Web图片检索研究[D];重庆大学;2009年
4 高文梁;改进的基于历史信息分析的网页排序算法[D];大连理工大学;2009年
5 陈翰生;基于改进HITS算法及位置信息的关键网页信息抽取方法[D];复旦大学;2009年
6 杨鑫;基于链接分析的电信呼叫数据研究与应用[D];北京邮电大学;2009年
7 朱自强;网络信息计量学理论与方法:大学网站网络流量及页面链接分析研究[D];南京理工大学;2005年
8 付克志;基于Web的文本信息检索算法的研究[D];大连理工大学;2006年
9 岳增慧;高校图书馆网络空间链接特征研究[D];曲阜师范大学;2011年
10 沈勇明;复杂网络中的链接预测[D];华南理工大学;2011年
,本文编号:2234668
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2234668.html