当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于本体的语义检索方法研究

发布时间:2017-08-26 03:05

  本文关键词:基于本体的语义检索方法研究


  更多相关文章: 本体 语义检索 语义相似度 查询扩展 局部共现


【摘要】:随着近几年科学技术的快速发展,互联网已成为人们获取信息资源的主要途径,在具有海量信息的互联网中,如何快速准确的获得所需要的资源成为了迫切需要解决的问题。传统的检索系统或搜索引擎主要是通过机械式的匹配关键词进行检索,对查询请求及信息资源缺乏语义层面上的理解与分析,导致实际检索结果与用户的查询需求不匹配。本体作为一种很好的概念建模工具,不仅能够在语义和知识层次上描述信息,反映概念之间的关系,而且支持逻辑推理操作,所以将本体引入到传统的信息检索系统中,利用本体的优势,实现查询的语义化,从而提高查全率和查准率。本文在分析和探讨了目前语义检索的常用方法后,进行了如下三方面的研究:(1)在深刻理解基于距离、基于内容和基于特征的相似度计算方法的基础上,提出了一种综合的加权语义相似度计算方法,综合考虑了两概念之间的语义距离、语义重合度和属性重合度。其中,在语义距离相似度的衡量过程中,分析了深度、细化程度和类型对有向边权重的影响;在语义重合度的计算上,加入了两概念之间的深度差因素,改进了不能够区分共同上层节点相同且深度和相等的概念对的语义重合度问题;属性重合度的计算方面,考虑到部分概念节点在继承上一层概念属性的基础上又定义了新的属性,给出了直接属性重合度和间接属性重合度的计算。实验结果表明,改进后的算法能更准确的衡量概念之间的相似度。(2)针对基于本体的查询扩展方法脱离待检索语料集的问题,本文将基于本体的语义查询扩展和基于局部文档的统计查询扩展相结合,提出了基于本体和局部共现共现的查询扩展方法。在本体中,由概念之间的相似度得到与初始概念相关度较大的概念作为语义候选扩展概念;同样在局部文档中,由共现性分析得到概念的统计候选扩展概念,再利用局部文档和本体分别对语义候选扩展概念和统计候选扩展概念进行筛选,筛选后的两部分扩展词作为最终的扩展概念。该扩展算法得到的新查询能更好地反映用户的查询请求。(3)研究基于本体的查询扩展过分依赖构建的领域本体的问题,提出基于概念相似度和相关度的查询扩展方法,即由概念在本体中的语义相似度和在局部文档中的相关度构成概念之间的关联度,使得概念之间关联度的衡量不再仅仅依靠本体,并根据概念与整个初始查询的相关度选取扩展词,此外还改进了扩展词权重的计算方法,由初始概念在局部文档中权重、在本体中的相似度和局部文档中的相关度共同决定。在设计的检索系统中,改进的算法有效的提高了检索性能。
【关键词】:本体 语义检索 语义相似度 查询扩展 局部共现
【学位授予单位】:兰州理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
  • 摘要7-8
  • Abstract8-12
  • 第1章 绪论12-16
  • 1.1 课题研究背景及意义12-13
  • 1.2 语义检索研究现状13-15
  • 1.2.1 基于本体的语义检索研究现状13-14
  • 1.2.2 其他语义检索研究现状14-15
  • 1.3 课题研究内容与组织结构15-16
  • 1.3.1 课题研究内容15
  • 1.3.2 本文组织结构15-16
  • 第2章 相关理论16-30
  • 2.1 信息检索概述16-19
  • 2.1.1 信息检索概念与基本原理16
  • 2.1.2 信息检索模型16-18
  • 2.1.3 信息检索分类18-19
  • 2.1.4 检索效果的评价19
  • 2.2 本体相关知识19-29
  • 2.2.1 本体的定义19-20
  • 2.2.2 本体的建模元语20-21
  • 2.2.3 本体的分类21-22
  • 2.2.4 本体的描述语言22-23
  • 2.2.5 本体的构建23-27
  • 2.2.6 本体的推理27-29
  • 2.3 本章小结29-30
  • 第3章 本体中概念之间相似度计算30-39
  • 3.1 概念相似度概述30-31
  • 3.1.1 概念的相似度含义30
  • 3.1.2 相似度的计算方法30-31
  • 3.2 基于本体的相似度计算方法31-32
  • 3.3 综合的加权相似度算法32-36
  • 3.3.1 语义距离32-34
  • 3.3.2 语义重合度34
  • 3.3.3 属性重合度34-35
  • 3.3.4 综合的加权语义相似度计算35-36
  • 3.4 实验及结果分析36-38
  • 3.5 本章小结38-39
  • 第4章 基于本体和局部共现的查询扩展方法39-49
  • 4.1 查询扩展技术39-42
  • 4.1.1 查询扩展概念39
  • 4.1.2 查询扩展方法39-42
  • 4.2 基于本体和局部共现的扩展方法42-45
  • 4.2.1 基本思想43
  • 4.2.2 获取候选扩展概念集43-44
  • 4.2.3 候选扩展概念集的筛选44-45
  • 4.2.4 扩展词的权重计算45
  • 4.3 实验及结果45-48
  • 4.3.1 实验设计45-46
  • 4.3.2 实验结果与分析46-48
  • 4.4 本章小结48-49
  • 第5章 一种基于本体的检索模型49-59
  • 5.1 基于概念相似度和相关度的查询扩展49-50
  • 5.1.1 基本思想49
  • 5.1.2 概念之间的关联度计算及扩展概念的选择49-50
  • 5.2 查询结果的排序50-51
  • 5.2.1 扩展词权重的计算50-51
  • 5.2.2 查询-文档相关度51
  • 5.3 实验及结果51-58
  • 5.3.1 实验设计51-53
  • 5.3.2 关键技术实现53-56
  • 5.3.3 实验结果56-58
  • 5.4 本章小结58-59
  • 总结和展望59-61
  • 参考文献61-65
  • 致谢65-66
  • 附录 攻读硕士学位期间所发表的学术论文66

【参考文献】

中国期刊全文数据库 前10条

1 张胜;;一种基于领域本体的语义检索模型[J];软件导刊;2014年03期

2 刘飞;周俏丽;张桂平;;基于辅助短语标记的名词短语识别[J];沈阳航空航天大学学报;2014年01期

3 李燕妮;李海生;蔡强;;旅游本体的概念相似度算法改进[J];计算机应用与软件;2014年01期

4 王璐;于超;王博;王国春;林金花;李辉;;本体语义检索系统[J];长春工业大学学报(自然科学版);2013年06期

5 孟红伟;张志平;张晓丹;;基于领域本体的文献智能检索模型研究[J];情报杂志;2013年09期

6 张春祥;栾博;高雪瑶;卢志茂;;基于句法分析的汉语词义消歧[J];计算机应用研究;2014年01期

7 王旭阳;万里;;信息检索中语义相似度算法研究[J];计算机工程与应用;2014年10期

8 盛秋艳;;一种基于本体的语义相似度计算方法[J];情报科学;2012年08期

9 王旭阳;萧波;;基于本体和局部上下文分析的查询扩展方法[J];计算机工程;2012年07期

10 刘宏哲;须德;;基于本体的语义相似度和相关度计算研究综述[J];计算机科学;2012年02期

中国博士学位论文全文数据库 前1条

1 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年

中国硕士学位论文全文数据库 前3条

1 魏晓莉;基于本体的语义检索关键技术研究[D];合肥工业大学;2013年

2 萧波;基于本体的新闻主题搜索研究[D];兰州理工大学;2012年

3 马中杰;基于领域本体的语义检索系统研究[D];安徽大学;2011年



本文编号:739251

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/739251.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户496b4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com