面向多源数据的军事本体构建系统
发布时间:2021-10-29 14:23
军事本体是辅助军事决策的重要基石之一,而军事本体主要组成部分是兵器本体。当前主要兵器知识的来源有两个,一是开放的军事类知识网站,二是人工采集梳理的知识,包括数据库和文档。本文研究从多种数据源提取军事本体的方法和工具,并设计和实现相应系统,以高效构建军事本体。本文的主要工作包括:(1)研究从多源数据中构建兵器本体的工程方案;(2)分析本体构建过程中,机器如何通过相似度计算完善本体构建方案;(3)分析自动从军事自然文本中抽取本体概念与关系的方法;(4)研究基于本体构建原则和知识规范的本体自动构建与检测的方法;(5)研究在构建兵器本体时,如何通过人机交互来提高构建效率与质量;(6)设计并实现一个能从多源数据中循环构建兵器本体的系统。本文的主要研究成果有:(1)设计了一种多源数据的本体构建方案和人机交互的本体构建流程;(2)解决了本体构建方案中的相关问题,实现了一系列关键技术;(3)实现了兵器本体构建系统。本文对系统关键技术、系统功能、系统性能进行测试,以航空母舰本体的构建为例评估本体,结果表明系统可以投入到实际应用中。这为进一步基于兵器本体的应用研究提供了基础,对于相关研究具有借鉴意义。
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
技术路线
第二章背景知识9国际化资源标识符(InternationalResourceIdentifier,IRI)用于标识资源。通常人们用来用作网址的统一资源定位符(UniformResourceLocator,URL)是IRI的一种,其他形式的IRI则仅提供一个标识符而不包含其位置与访问相关的信息。IRI本身则是统一资源标识符(UniformResourceIdentifier,URI)的一个泛化概念。所有能用RDF表达式表述的事物都可以称作“资源”,在RDF模型中,资源以资源标识符的形式标识,资源标识符由一个唯一资源标识符(URI)和一个可选的ID组成,如某个HTML网页地址也是一个资源描述符。属性用来描述资源某个特定的方面,如特征、关系等。每一种属性都有其特定的含义,并且含义也限制了属性值的取值范围,以及与其他资源之间的关系。通常有两种做法指定RDF数据的含义:1)使用预先设计好的词典的URI,如DublinCore[43];2)使用本体来指定含义。RDF本身是不知道它所用的IRI的具体含义的,但是我们从IRI的写法上得到一定的信息,比如形如http://dbpedia.org/resource/Name的DBpedia资源表示Wikipedia上有对应的文章。RDFS(RDFSchemalanguage)[44]提供了RDF词汇表的定义方式,这种语言允许我们去定义RDF数据的语义信息。比如,http://www.example.org/friendOf这个IRI可以被用作属性,并且其主体和客体必须是http://www.example.org/Person类型的资源。2.1.2OWLOWL(WebOntologyLanguage)[45]是一种本体表示语言,被设计用于表示复杂知识,事物的类别,以及事物之间的关系。OWL是一种基于逻辑的可计算语言,因此以OWL表示的知识可以用推理程序推理以验证其知识的一致性或者从中挖掘出部分隐含知识。图2-1简单的RDF三元组示范
第二章背景知识112.2.2本体的表示规范过去的工作中以万国兵器网的数据为基础,构建了一个原始本体,模式层如图2-2所示,在后续工作中采用与万国兵器网一致的本体表示规范。规范中,“飞行器”、“战斗机”这样的武器种类作为本体中的类,“F-22战斗机”这样具体的武器作为本体中的实例;对象类型属性上会附带其他内容,比如“某舰船在某港口停留时间”、“某飞机携带某导弹数量”等,所以需要通过空节点连接两个对象类型属性的实例,其中的“停留时间”和“数量”等信息在空节点中表示,空节点的作为实例,uri通过UUID表示。附录A详细描述了本体表示的规范。本文中按照模式层和实例层划分本体,模式层包括本体类和类之间的关系、属性和属性之间的关系、类的属性描述等,实例层包括所有的实例和实例的具体描述。所有知识都按本体的规范表示出来后,最终会统一存储在图数据库中,作为后续工作参考的背景知识库。经过调研,图数据库Neo4j与课题最为契合[47]。图数据库点边点图2-2万国兵器网本体模式层图2-3图数据库存储示范
【参考文献】:
期刊论文
[1]基于深度学习的军事命名实体识别方法[J]. 王学锋,杨若鹏,朱巍. 装甲兵工程学院学报. 2018(04)
[2]一种面向军事文本的领域特征词向量描述方法[J]. 秦杰,曹雷,彭辉,赖俊. 计算机工程. 2016(08)
[3]中文领域知识半自动化OWL本体构建方法研究[J]. 董洋溢,李伟华,陈世亮. 计算机应用与软件. 2016(05)
[4]面向军事文本的命名实体识别[J]. 冯蕴天,张宏军,郝文宁. 计算机科学. 2015(07)
[5]基于关系数据库的军事训练本体自动构建模型[J]. 冯波,郝文宁,宋杰,杨剑,占栋辉. 指挥信息系统与技术. 2013(05)
[6]中文分词算法之最大匹配算法的研究[J]. 张玉茹. 现代计算机(专业版). 2011(19)
[7]军事文献中复杂字母词语的形式分析[J]. 杨森. 社科纵横(新理论版). 2010(03)
[8]中文本体构建及可视化研究[J]. 王晓盈,王晓璇,刘鹏. 计算机技术与发展. 2010(02)
[9]维基百科与百度百科比较分析[J]. 罗志成,关婉湫,张勤. 情报理论与实践. 2009(04)
[10]领域本体建模方法研究[J]. 李恒杰,李军权,李明. 计算机工程与设计. 2008(02)
博士论文
[1]通用本体学习方法及其应用的关键技术研究[D]. 刁丽娟.华东师范大学 2015
[2]领域本体的构建方法与应用研究[D]. 李景.中国农业科学院 2009
硕士论文
[1]基于百度百科的人物新闻本体自动构建研究与实现[D]. 李文忠.武汉理工大学 2017
[2]基于中文文本的本体学习关键技术研究[D]. 马传宾.西安邮电大学 2016
[3]本体质量评估方法研究与实现[D]. 廖莉莉.南京航空航天大学 2015
[4]一种基于百度百科的中文领域本体构建方法[D]. 刘宇航.东北大学 2013
本文编号:3464823
【文章来源】:东南大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
技术路线
第二章背景知识9国际化资源标识符(InternationalResourceIdentifier,IRI)用于标识资源。通常人们用来用作网址的统一资源定位符(UniformResourceLocator,URL)是IRI的一种,其他形式的IRI则仅提供一个标识符而不包含其位置与访问相关的信息。IRI本身则是统一资源标识符(UniformResourceIdentifier,URI)的一个泛化概念。所有能用RDF表达式表述的事物都可以称作“资源”,在RDF模型中,资源以资源标识符的形式标识,资源标识符由一个唯一资源标识符(URI)和一个可选的ID组成,如某个HTML网页地址也是一个资源描述符。属性用来描述资源某个特定的方面,如特征、关系等。每一种属性都有其特定的含义,并且含义也限制了属性值的取值范围,以及与其他资源之间的关系。通常有两种做法指定RDF数据的含义:1)使用预先设计好的词典的URI,如DublinCore[43];2)使用本体来指定含义。RDF本身是不知道它所用的IRI的具体含义的,但是我们从IRI的写法上得到一定的信息,比如形如http://dbpedia.org/resource/Name的DBpedia资源表示Wikipedia上有对应的文章。RDFS(RDFSchemalanguage)[44]提供了RDF词汇表的定义方式,这种语言允许我们去定义RDF数据的语义信息。比如,http://www.example.org/friendOf这个IRI可以被用作属性,并且其主体和客体必须是http://www.example.org/Person类型的资源。2.1.2OWLOWL(WebOntologyLanguage)[45]是一种本体表示语言,被设计用于表示复杂知识,事物的类别,以及事物之间的关系。OWL是一种基于逻辑的可计算语言,因此以OWL表示的知识可以用推理程序推理以验证其知识的一致性或者从中挖掘出部分隐含知识。图2-1简单的RDF三元组示范
第二章背景知识112.2.2本体的表示规范过去的工作中以万国兵器网的数据为基础,构建了一个原始本体,模式层如图2-2所示,在后续工作中采用与万国兵器网一致的本体表示规范。规范中,“飞行器”、“战斗机”这样的武器种类作为本体中的类,“F-22战斗机”这样具体的武器作为本体中的实例;对象类型属性上会附带其他内容,比如“某舰船在某港口停留时间”、“某飞机携带某导弹数量”等,所以需要通过空节点连接两个对象类型属性的实例,其中的“停留时间”和“数量”等信息在空节点中表示,空节点的作为实例,uri通过UUID表示。附录A详细描述了本体表示的规范。本文中按照模式层和实例层划分本体,模式层包括本体类和类之间的关系、属性和属性之间的关系、类的属性描述等,实例层包括所有的实例和实例的具体描述。所有知识都按本体的规范表示出来后,最终会统一存储在图数据库中,作为后续工作参考的背景知识库。经过调研,图数据库Neo4j与课题最为契合[47]。图数据库点边点图2-2万国兵器网本体模式层图2-3图数据库存储示范
【参考文献】:
期刊论文
[1]基于深度学习的军事命名实体识别方法[J]. 王学锋,杨若鹏,朱巍. 装甲兵工程学院学报. 2018(04)
[2]一种面向军事文本的领域特征词向量描述方法[J]. 秦杰,曹雷,彭辉,赖俊. 计算机工程. 2016(08)
[3]中文领域知识半自动化OWL本体构建方法研究[J]. 董洋溢,李伟华,陈世亮. 计算机应用与软件. 2016(05)
[4]面向军事文本的命名实体识别[J]. 冯蕴天,张宏军,郝文宁. 计算机科学. 2015(07)
[5]基于关系数据库的军事训练本体自动构建模型[J]. 冯波,郝文宁,宋杰,杨剑,占栋辉. 指挥信息系统与技术. 2013(05)
[6]中文分词算法之最大匹配算法的研究[J]. 张玉茹. 现代计算机(专业版). 2011(19)
[7]军事文献中复杂字母词语的形式分析[J]. 杨森. 社科纵横(新理论版). 2010(03)
[8]中文本体构建及可视化研究[J]. 王晓盈,王晓璇,刘鹏. 计算机技术与发展. 2010(02)
[9]维基百科与百度百科比较分析[J]. 罗志成,关婉湫,张勤. 情报理论与实践. 2009(04)
[10]领域本体建模方法研究[J]. 李恒杰,李军权,李明. 计算机工程与设计. 2008(02)
博士论文
[1]通用本体学习方法及其应用的关键技术研究[D]. 刁丽娟.华东师范大学 2015
[2]领域本体的构建方法与应用研究[D]. 李景.中国农业科学院 2009
硕士论文
[1]基于百度百科的人物新闻本体自动构建研究与实现[D]. 李文忠.武汉理工大学 2017
[2]基于中文文本的本体学习关键技术研究[D]. 马传宾.西安邮电大学 2016
[3]本体质量评估方法研究与实现[D]. 廖莉莉.南京航空航天大学 2015
[4]一种基于百度百科的中文领域本体构建方法[D]. 刘宇航.东北大学 2013
本文编号:3464823
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3464823.html