当前位置:主页 > 社科论文 > 图书档案论文 >

多专业领域本体的构建及语义检索研究

发布时间:2020-05-16 19:42
【摘要】: 本体在软件工程、人工智能、信息检索、Web服务发现等领域中扮演着越来越重要的角色。依照领域依赖程度,可以将本体分为通用本体(Top Ontology)、领域本体(Domain Ontology)、任务本体(Task Ontology)和应用本体(ApplicationOntology)。领域本体可以有效地组织领域中的知识,使知识更好地共享、重用。有一些领域,如农业领域、铁路领域、高速铁路领域、航空领域等,这些领域都由不同的专业领域构成,如高速铁路领域由工务工程、牵引供电、动车组、运营管理等专业领域构成。本文面向由多专业构成的领域,以铁道部科技研究开发计划重大课题(Z2006-094)和教育部科技基础资源数据平台项目(507002)为支撑,以高速铁路领域为实证背景,研究多专业领域本体构建方法论和基于多专业领域本体的应用——语义检索和推理,主要做了以下几个方面的工作: (1)提出了一种多专业领域本体构建方法 本文面向由多专业构成的领域,在对已有本体构建方法和由多专业构成的领域知识特点深入研究的基础上,探讨了多专业领域本体构建思路,提出了一种建立在“范畴表和主题词表”基础上的多专业领域本体构建方法MMDOB(MultipleMaiors Domain Ontology Building)。此方法先基于叙词表或范畴与主题词表构建各专业领域本体,然后集成为统一的多专业领域本体。在由各专业领域本体集成为多专业领域本体时,根据由多专业构成的领域的实际情况,提出一种多专业领域本体集成方法MMDOI(Multiple Majors Domain Ontology Integration)和一个三层的多专业领域本体集成框架。 (2)给出了多专业领域本体模型和概念语义相似度计算方法 针对集成后的统一的多专业领域本体,在对现有的本体模型和多专业领域本体深入研究的基础上,提出了多专业领域本体模型的八元组表示方法和概念的九元组表示方法及其形式化描述方式。 概念语义相似度计算是语义扩展检索中用户查询词扩展必不可少的一种方法,基于本文给出的多专业领域本体概念模型,构建了计算多专业领域本体概念之间语义相似度的MD4(Fourfold Matching-Distance Model)模型,并给出了该模型的详细算法。 (3)给出了五种语义扩展检索模式 扩展检索是通过查找检索条件中的相关概念,从而得到相关知识项。本文针对多专业领域本体的特点和其检索对象对用户查询语义扩展模式进行了分析,给出了五种语义扩展检索模式。以OWL为推理基础,对领域本体语义关系和推理规则进行了阐述。 (4)给出了在本文方法指导下的多专业领域——高速铁路领域的实证分析 在本文提出的多专业领域本体构建方法MMDOB的指导下,构建了高速铁路领域各专业本体,并将其集成为统一的多专业领域本体;在此基础上,本文设计和开发了一个面向高速铁路知识的语义检索和推理系统HSRK-SRRS(High-speedRailway Knowledge-Semantic Retrieval and Reasoning System),对本文提出的基于“范畴表和主题词表”的多专业领域本体构建方法、语义扩展检索方法和语义关系推理进行了实验验证。 本文提出的多专业领域本体构建方法有一定的现实意义,对多专业领域本体构建、概念之间语义关系分析和多专业领域本体集成有一定的借鉴作用;同时,基于多专业领域本体模型构建的计算领域本体概念之间语义相似度的MD4模型,为由多专业构成的领域本体概念之间的语义关系提供了一种有效的量化方法;本文将多专业领域研究成果应用于高速铁路领域,为由多专业构成的领域本体的构建及其语义检索与推理的实现提供了一个实证参考。
【图文】:

本体语言,本体


理效率的折衷,我们一般选择 OWLDL或者 OWLLite作为构建本体时所使用的本体语言,在本文中我们选择 OWLLite作为多专业领域本体的描述语言。图1一1刻画了上述面向语义叭触b的本体语言之间的关系。图1一1面向语义W七b的本体语言之间的关系Figurel一 1RelationshiPbetweenOntologyLanguagesforSemantie从/eb(2)本体推理Bemers一Lee给出了基于XML[6’]和RDF/RDFs[65]语义网的层次关系,,并在此基础上构建了本体和逻辑推理规则,使计算机能够理解和处理基于语义的知识表示和推理。RDF[65]与owL[66】语言是谓词逻辑的特例。RDF与owL提供了一个非常适合

语义,标引,文档处理


图4一语义标引模型Figure4一 2SemantieIndexingModel结合以上分析,本文建立基于本体的语义标引模型,如图4一2所示。模型中既给出了语义标引的流程,也指明了关键的处理过程。图4一2中以初始文档集为起点,以语义向量的存储为终点。模型涉及4个相对独立的处理过程:文档处理、语义标引、文档语义向量抽取和本体解析。语义标引过程是模型的核心,但它需要文档处理和本体解析两个处理为其提供服务。文档处理产生的结果作为下一步处理语义标引的输入,而本体解析的结果也作为语义标引的输入。最终声称文档语义向量存储到关系数据库或文档中。4个处理过程的功能定义如下:(l)文档处理。以初始文档集为输入,对文档进行标引,并将经过标引的文
【学位授予单位】:北京交通大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:G354

【引证文献】

相关博士学位论文 前3条

1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年

2 宋昕;基于本体和进化算法的散杂货港口堆场智能调度系统研究[D];北京交通大学;2013年

3 王璇;基于多代理的通信领域虚拟服务系统构建研究[D];北京交通大学;2014年



本文编号:2667213

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2667213.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户409f3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com