当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于相似度量矩阵HITS的改进算法

发布时间:2018-05-06 02:21

  本文选题:HITS算法 + 主题漂移 ; 参考:《微电子学与计算机》2010年07期


【摘要】:HITS算法是基于超链接结构的搜索引擎算法,但它对超链接不加以区分,容易产生"主题漂移"现象.改进后的HITS算法在原算法的基础上,提出了相似度量的迭代方法.该方法是将网页超链接结构信息、文本信息、联合引用信息结合成一个相似度量权重矩阵,通过权重矩阵来归一HITS算法每次产生的Authority、Hub值.在查询效率和质量方面,改进的HITS算法更优,也减少了"主题漂移"现象的发生.
[Abstract]:HITS algorithm is a search engine algorithm based on hyperlink structure, but it does not distinguish hyperlinks, which is easy to produce "topic drift" phenomenon. Based on the original algorithm, the improved HITS algorithm proposes an iterative method of similarity measure. In this method, the hyperlink structure information, text information and reference information are combined into a similarity weight matrix, and the weight matrix is used to convert the AuthorityHub value produced each time by the HITS algorithm. In terms of query efficiency and quality, the improved HITS algorithm is better and reduces the "topic drift" phenomenon.
【作者单位】: 辽宁工业大学电子与信息工程学院;辽宁工业大学数理科学系;
【基金】:国家自然科学基金项目(60674056) 辽宁省教育厅科学研究基金(20060409)
【分类号】:TP391.3

【参考文献】

相关期刊论文 前4条

1 张敏,高剑峰,马少平;基于链接描述文本及其上下文的Web信息检索[J];计算机研究与发展;2004年01期

2 夏天;;汉语词语语义相似度计算研究[J];计算机工程;2007年06期

3 崔志明,谢春丽;基于Web的文本挖掘研究[J];微电子学与计算机;2002年10期

4 汤亚玲;崔志明;;遗传算法在Web关联挖掘中的应用研究[J];微电子学与计算机;2006年06期

【共引文献】

相关期刊论文 前10条

1 蒋溢;丁优;熊安萍;王化晶;;一种基于知网的词汇语义相似度改进计算方法[J];重庆邮电大学学报(自然科学版);2009年04期

2 周翔;;基于Websphinx网络爬虫的研究与改进[J];电脑知识与技术;2008年28期

3 邵良杉;付曙光;薛立军;;企业核心竞争力的Web挖掘[J];辽宁工程技术大学学报;2007年01期

4 汪克夷;齐丽云;;基于文本聚类的客户知识获取和应用研究[J];管理学报;2007年03期

5 付涛;戴玉刚;周登;;链接分析在主题信息检索系统中的应用[J];电脑与电信;2009年01期

6 魏秀然;李建芳;刘安民;闾素红;;基于Web的数据挖掘技术及应用[J];华北水利水电学院学报;2009年02期

7 朱绍军;兰帆;黄明和;;Web结构挖掘算法研究[J];计算机与信息技术;2009年04期

8 傅鹤岗;徐晨霞;;基于知网的元搜索引擎多关键词检索研究[J];计算机工程与应用;2008年22期

9 张泊平;张得喜;;基于网页结构相关性的隐马尔可夫预取技术研究[J];计算机与数字工程;2007年05期

10 王军;彭建;;网络爬虫的结构设计研究[J];科技信息(学术研究);2007年27期

相关会议论文 前4条

1 曾令明;金虎;;基于遗传算法的双向关联规则挖掘[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

2 崔磊;陈清才;郭鸿志;王晓龙;;HowNet与维基百科知识融合中的义类属性自动构建方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

3 赵燕平;李超;;网络安全信息挖掘中的特征选择与专利分析研究[A];2004年中国管理科学学术会议论文集[C];2004年

4 张冠元;林健;;一种针对餐馆评论的文本倾向性分析算法[A];第五届全国信息检索学术会议论文集[C];2009年

相关博士学位论文 前3条

1 刘紫玉;多专业领域本体的构建及语义检索研究[D];北京交通大学;2010年

2 王树梅;信息检索相关技术研究[D];南京理工大学;2007年

3 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年

相关硕士学位论文 前10条

1 王恒;中文问答系统的研究与实现[D];哈尔滨工业大学;2008年

2 徐家宁;基于免疫网络的文本挖掘方法研究[D];长沙理工大学;2008年

3 张维维;搜索引擎的研究与实现[D];长春理工大学;2008年

4 张福辉;基于XML和SVM的Web文本挖掘研究[D];电子科技大学;2008年

5 吕克强;Web超链分析及其在搜索引擎中的应用研究[D];中国石油大学;2008年

6 王军;基于文本分类的WEB信息检索技术的研究[D];大连交通大学;2008年

7 王攀;主题搜索引擎的设计与实现[D];华中科技大学;2007年

8 徐晨霞;基于知网的多关键字检索研究[D];重庆大学;2008年

9 马春光;基于用户兴趣的查询扩展算法研究[D];哈尔滨工程大学;2009年

10 汤亚玲;基于遗传算法的Web关联规则挖掘的研究与设计[D];苏州大学;2004年

【二级参考文献】

相关期刊论文 前8条

1 夏天,樊孝忠,刘林,骆正华;基于ALICE的汉语自然语言接口[J];北京理工大学学报;2004年10期

2 刘亚军,徐易;一种基于加权语义相似度模型的自动问答系统[J];东南大学学报(自然科学版);2004年05期

3 陈劲松,施小英;一种关联规则增量更新算法[J];计算机工程;2002年07期

4 李有梅;基于词义的关键词抽取方法研究[J];情报理论与实践;2000年02期

5 冯玉才,冯剑琳;关联规则的增量式更新算法[J];软件学报;1998年04期

6 崔志明,汤亚玲;挖掘关联规则频繁项集的算法研究及其Prolog实现[J];微电子学与计算机;2003年09期

7 汤亚玲,崔志明;基于遗传算法的Web用户聚类模型的研究[J];微电子学与计算机;2004年08期

8 朱毅华,侯汉清,沙印亭;计算机识别汉语同义词的两种算法比较和测评[J];中国图书馆学报;2002年04期

【相似文献】

相关期刊论文 前10条

1 谭国真,,高文,张田文;多边形表示的相似度量[J];计算机辅助设计与图形学学报;1995年02期

2 张诚一,石玉强;两类正规模糊集的相似度量[J];计算机工程与应用;2005年14期

3 李凡,饶勇,于三禄;基于相似度量的加权近似推理方法[J];华中科技大学学报;2000年12期

4 骆敏舟,周美立;实例推理检索中相似度量方法的研究[J];合肥工业大学学报(自然科学版);2001年06期

5 黄国顺,刘云生;Vague集相似度量及其在模式识别中的应用[J];复旦学报(自然科学版);2004年05期

6 王洪凯,管延勇,史开泉;粗集间的相似度量及其应用[J];计算机工程与应用;2004年31期

7 黄国顺,刘云生;基于距离意义下的Vague集相似度量比较研究[J];计算机工程与应用;2004年35期

8 李凡,徐章艳,吕泽华;一个基于Vague集相似度量的近似推理方法[J];计算机工程与科学;2002年05期

9 刘菲斐;闫德勤;;粗糙Vague集及其相似度量[J];辽宁师范大学学报(自然科学版);2006年03期

10 李东亚;张诚一;王鸿绪;;基于Vague集加权相似度量的近似推理[J];河南师范大学学报(自然科学版);2007年02期

相关会议论文 前10条

1 苏毅娟;;一种新的Vague集相似度量方式[A];广西计算机学会2006年年会论文集[C];2006年

2 张东风;张金隆;刘玉青;;基于Vague集相似度量的多目标模糊决策[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年

3 章志凌;虞立群;罗海飞;邵晓敏;;基于改进Corpus库的词语相似度计算方法[A];第二十四届中国控制会议论文集(下册)[C];2005年

4 徐炜;贺占庄;黄士坦;;基于模糊相似计算的快速图像匹配[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年

5 何维来;关华勇;关东东;童晶;;基于Voronoi域积分的三维人脸识别方法[A];第十二届全国图象图形学学术会议论文集[C];2005年

6 倪国文;刘爱伦;;基于核主元分析的非线性故障检测研究[A];2009中国仪器仪表与测控技术大会论文集[C];2009年

7 汪慧兰;周伟华;罗斌;;基于边缘方向自相关图与局部颜色的图像检索[A];第十二届全国图象图形学学术会议论文集[C];2005年

8 赵丽元;黄天民;;一种基于Vague集的区间值加权模糊推理方法[A];2007中国控制与决策学术年会论文集[C];2007年

9 周晓蕾;唐明浩;於思俊;;服装款式系统中的相似性度量算法研究[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年

10 胡日勒;宗成庆;徐波;;基于短语结构抽取和对齐的机器翻译模板自动获取方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年

相关博士学位论文 前6条

1 李艳红;信息系统敏捷性及其相关技术的研究[D];大连理工大学;2002年

2 管延勇;粗糙集与信息系统约简—决策规则优化[D];山东大学;2006年

3 韩诚;R_0代数及Vague集的相似度理论[D];陕西师范大学;2006年

4 刘华文;[D];山东大学;2005年

5 刘华文;直觉模糊与区间值模糊环境下的多准则决策与推理算法[D];山东大学;2005年

6 沈云涛;基于视觉感知特性的图像检索研究[D];西北工业大学;2005年

相关硕士学位论文 前10条

1 章四兵;基于相似度量的机械产品系统的分类方法研究[D];合肥工业大学;2004年

2 戴声扬;基于新的相似度量和相关反馈算法的图象检索系统[D];清华大学;2004年

3 虞万荣;数字图书馆图像检索技术研究与实现[D];国防科学技术大学;2001年

4 季清梅;军用数字图书馆图像检索技术的研究与实现[D];大连理工大学;2003年

5 马翠;直觉模糊集的性质及其应用[D];重庆大学;2008年

6 庄代波;一种Apriori的改进算法[D];浙江大学;2003年

7 常传勇;基于特征的机械产品系统相似度量方法研究[D];合肥工业大学;2005年

8 田应忠;基于模糊集的模糊专家系统研究与应用[D];华中科技大学;2004年

9 肖海萍;汽车底盘分析方法及其相似性研究[D];合肥工业大学;2006年

10 张超群;基于网页分块技术的主题爬行[D];吉林大学;2007年



本文编号:1850356

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1850356.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1b128***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com