当前位置:主页 > 科技论文 > 软件论文 >

基于中文文本的本体学习关键技术研究

发布时间:2017-10-06 11:03

  本文关键词:基于中文文本的本体学习关键技术研究


  更多相关文章: 语义Web 知识图谱 本体学习 本体概念 本体关系


【摘要】:随着大数据时代的到来,Internet上的知识数量呈现指数级增长,其内容变得更加丰富、形式更加多样,如何将这些知识进行快速地、准确地组织和管理成为计算机相关领域的研究热点。本体(Ontology)作为解决语义层次上Web信息共享和交换的基础,自提出以来就引起了国内外学者的广泛关注。因此,本体的相关研究具有重要意义,其研究的主要内容包括本体构建、本体映射以及本体应用等。针对当前手工构建本体耗时费力、难以动态更新等诸多瓶颈问题,本文重点对自动或者半自动构建本体即本体学习进行研究,主要研究内容包括本体概念抽取、概念关系抽取等方面,其中概念关系主要分为分类关系(上下位关系)和非分类关系。针对本体学习的相关研究,本文工作主要包括以下几个方面:(1)本体概念作为本体的基石,决定了本体构建的质量。对于本体概念抽取的研究方法:首先,分析了目前一些常用的本体概念抽取方法,领域一致度与领域相关度相结合的方法以及CCM与TFIDF相结合的方法;然后;针对TFIDF方法未考虑到概念在语料集中分布的情况,提出了一种CCM与TFIDFE相结合的概念抽取方法;最后,将上述这些方法做出对比分析,验证了本文所提出方法的有效性。(2)上下位关系作为本体的基本骨架,能够将本体概念进行层次化划分。结合改进的K-Means聚类算法,提出一种分类关系抽取方法:首先,构建领域概念的空间向量模型VSM;然后,为减少单一采用余弦距离计算概念间相似度引起的误差,本文利用欧几里德距离与余弦距离相加权的方式计算概念间的相似度;最后,采用改进的K-Means算法进行概念聚类,并引入Sil指标函数作为确定最优簇类数K的方法。实验结果表明,采用该方法可以取得较好的聚类效果。(3)非分类关系作为本体的主要枝干,使得本体更加完备。对于非分类关系抽取的研究方法:首先,采用关联规则方法抽取共现的概念对;然后,根据概念、动词共振性原理,采用VF*ICF方法获取与概念共现的领域动词,并将其作为关系标签;最后,结合对数似然比方法LLR计算上述抽取的概念对与关系标签的相关性,进而获取非分类关系。结合上述研究方法,本文提出了一种本体学习框架,并实现了基于文本的本体学习原型系统。该原型系统实现了对本体概念、分类关系、非分类关系的抽取,并将抽取的领域本体持久化到数据库中。
【关键词】:语义Web 知识图谱 本体学习 本体概念 本体关系
【学位授予单位】:西安邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【目录】:
  • 摘要3-4
  • ABSTRACT4-8
  • 第1章 绪论8-12
  • 1.1 研究背景及意义8-9
  • 1.1.1 研究背景8
  • 1.1.2 研究意义8-9
  • 1.2 国内外研究现状9-10
  • 1.2.1 本体概念抽取研究现状9-10
  • 1.2.2 本体分类关系获取研究现状10
  • 1.2.3 本体非分类关系获取研究现状10
  • 1.3 论文的研究工作及组织结构10-12
  • 第2章 本体及本体学习理论12-20
  • 2.1 本体12-14
  • 2.1.1 本体定义12
  • 2.1.2 本体建模元语12
  • 2.1.3 本体描述语言12-13
  • 2.1.4 本体分类13-14
  • 2.2 本体构建14-16
  • 2.2.1 本体构建原则14
  • 2.2.2 本体构建方法14-16
  • 2.3 本体学习16-19
  • 2.3.1 本体学习内容16-17
  • 2.3.2 本体学习分类17-18
  • 2.3.3 本体学习工具18-19
  • 2.4 本章小结19-20
  • 第3章 本体概念抽取20-30
  • 3.1 常用概念抽取方法20-23
  • 3.1.1 概述20-21
  • 3.1.2 领域一致度和领域相关度相结合的概念抽取21
  • 3.1.3 CCM与TFIDF相结合的概念抽取21-23
  • 3.2 CCM与TFIDFE相结合的概念抽取方法23-26
  • 3.2.1 信息熵24
  • 3.2.2 TFIDFE24-26
  • 3.3 实验结果与分析26-29
  • 3.3.1 实验数据介绍26
  • 3.3.2 结果及分析26-29
  • 3.4 本章小结29-30
  • 第4章 本体概念间关系的抽取30-46
  • 4.1 分类关系抽取30-37
  • 4.1.1 概述30-31
  • 4.1.2 K-means聚类算法31-32
  • 4.1.3 改进的K-Means算法抽取分类关系32-37
  • 4.2 非分类关系抽取37-42
  • 4.2.1 概述37-38
  • 4.2.2 关联规则抽取概念对38-39
  • 4.2.3 VF~*ICF抽取领域动词39-40
  • 4.2.4 对数似然比抽取非分类关系40-42
  • 4.3 实验结果与分析42-45
  • 4.3.1 分类关系抽取结果与分析42-43
  • 4.3.2 非分类关系抽取结果与分析43-45
  • 4.4 本章小结45-46
  • 第5章 原型系统的设计与实现46-56
  • 5.1 系统设计及开发环境46-47
  • 5.1.1 系统设计46
  • 5.1.2 系统开发环境46-47
  • 5.2 系统模块功能及功能实现47-55
  • 5.2.1 系统模块功能47-52
  • 5.2.2 系统主要功能实现52-55
  • 5.3 本章小结55-56
  • 第6章 总结与展望56-58
  • 6.1 工作总结56
  • 6.2 下一步研究工作展望56-58
  • 参考文献58-62
  • 攻读学位期间取得的研究成果62-64
  • 致谢64-65


本文编号:982395

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/982395.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户756dc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com