当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于概念的网页相似度处理算法研究

发布时间:2018-05-01 23:26

  本文选题:相似网页 + 概念抽取 ; 参考:《计算机应用》2006年12期


【摘要】:针对海量网页信息,提出适于搜索引擎使用的网页相似度处理算法。算法依据网页抽象形成的概念,在倒排文档基础上建立相似度处理模型。该模型缩小了需要进行相似度计算的网页文档范围,节约大量时间和空间资源,为优化相似度计算奠定了良好基础。
[Abstract]:A web page similarity processing algorithm suitable for search engines is proposed for massive web page information. Based on the concept of web page abstraction, the algorithm builds a similarity processing model based on inverted documents. The model reduces the scope of web pages which need similarity calculation, saves a lot of time and space resources, and lays a good foundation for the optimization of similarity calculation.
【作者单位】: 西北工业大学计算机学院 西北工业大学计算机学院
【基金】:西北工业大学研究生创业种子基金资助项目(Z200644)
【分类号】:TP391.1

【相似文献】

相关期刊论文 前10条

1 谷俊;王昊;;基于领域中文文本的术语抽取方法研究[J];现代图书情报技术;2011年04期

2 熊平原;王毅;陈庆新;毛宁;;基于压铸模本体的领域概念自动抽取方法研究[J];机械设计与制造;2011年07期

3 张海粟;马大明;邓智龙;;基于维基百科的语义知识库及其构建方法研究[J];计算机应用研究;2011年08期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相关会议论文 前1条

1 冯淑芳;王素格;;面向观点挖掘的汽车本体知识库的构建[A];第六届全国信息检索学术会议论文集[C];2010年

相关博士学位论文 前4条

1 周子力;基于WordNet的本体构建及其在安全领域应用关键技术研究[D];华东师范大学;2009年

2 侯鑫;基于本体的设计重用技术研究及其在CAFD中的应用[D];哈尔滨工业大学;2010年

3 侯鑫;基于本体的设计重用技术研究及其在CAFD中的应用[D];哈尔滨工业大学;2010年

4 翟延冬;基于WordNet的短文本语义网挖掘算法研究[D];吉林大学;2012年

相关硕士学位论文 前10条

1 关键;面向中文文本本体学习概念抽取的研究[D];吉林大学;2010年

2 程波波;基于文本的茶学本体学习方法研究[D];安徽农业大学;2010年

3 谢彩云;基于法律领域的本体学习方法的研究与应用[D];南昌大学;2012年

4 官莹莹;面向中文文本的本体学习方法研究[D];吉林大学;2009年

5 郑鹏;搜索引擎中的相似网页探测算法研究[D];华中科技大学;2008年

6 程英迅;基于军事本体的智能检索引擎研究[D];电子科技大学;2010年

7 舒万里;中文领域本体学习中概念和关系抽取的研究[D];重庆大学;2012年

8 李倩;基于概念格的检索系统中概念挖掘技术的研究[D];北京邮电大学;2008年

9 王晓庆;基于框架语义的中文本体学习研究[D];中国海洋大学;2008年

10 宋宣辰;基于统计与语义分析的多文档自动摘要研究[D];中国科学技术大学;2009年



本文编号:1831449

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1831449.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cea91***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com