基于概念的网页相似度处理算法研究
本文选题:相似网页 + 概念抽取 ; 参考:《计算机应用》2006年12期
【摘要】:针对海量网页信息,提出适于搜索引擎使用的网页相似度处理算法。算法依据网页抽象形成的概念,在倒排文档基础上建立相似度处理模型。该模型缩小了需要进行相似度计算的网页文档范围,节约大量时间和空间资源,为优化相似度计算奠定了良好基础。
[Abstract]:A web page similarity processing algorithm suitable for search engines is proposed for massive web page information. Based on the concept of web page abstraction, the algorithm builds a similarity processing model based on inverted documents. The model reduces the scope of web pages which need similarity calculation, saves a lot of time and space resources, and lays a good foundation for the optimization of similarity calculation.
【作者单位】: 西北工业大学计算机学院 西北工业大学计算机学院
【基金】:西北工业大学研究生创业种子基金资助项目(Z200644)
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 谷俊;王昊;;基于领域中文文本的术语抽取方法研究[J];现代图书情报技术;2011年04期
2 熊平原;王毅;陈庆新;毛宁;;基于压铸模本体的领域概念自动抽取方法研究[J];机械设计与制造;2011年07期
3 张海粟;马大明;邓智龙;;基于维基百科的语义知识库及其构建方法研究[J];计算机应用研究;2011年08期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前1条
1 冯淑芳;王素格;;面向观点挖掘的汽车本体知识库的构建[A];第六届全国信息检索学术会议论文集[C];2010年
相关博士学位论文 前4条
1 周子力;基于WordNet的本体构建及其在安全领域应用关键技术研究[D];华东师范大学;2009年
2 侯鑫;基于本体的设计重用技术研究及其在CAFD中的应用[D];哈尔滨工业大学;2010年
3 侯鑫;基于本体的设计重用技术研究及其在CAFD中的应用[D];哈尔滨工业大学;2010年
4 翟延冬;基于WordNet的短文本语义网挖掘算法研究[D];吉林大学;2012年
相关硕士学位论文 前10条
1 关键;面向中文文本本体学习概念抽取的研究[D];吉林大学;2010年
2 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年
3 谢彩云;基于法律领域的本体学习方法的研究与应用[D];南昌大学;2012年
4 官莹莹;面向中文文本的本体学习方法研究[D];吉林大学;2009年
5 郑鹏;搜索引擎中的相似网页探测算法研究[D];华中科技大学;2008年
6 程英迅;基于军事本体的智能检索引擎研究[D];电子科技大学;2010年
7 舒万里;中文领域本体学习中概念和关系抽取的研究[D];重庆大学;2012年
8 李倩;基于概念格的检索系统中概念挖掘技术的研究[D];北京邮电大学;2008年
9 王晓庆;基于框架语义的中文本体学习研究[D];中国海洋大学;2008年
10 宋宣辰;基于统计与语义分析的多文档自动摘要研究[D];中国科学技术大学;2009年
,本文编号:1831449
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1831449.html