当前位置:主页 > 社科论文 > 图书档案论文 >

基于Wikidata的机构本体构建研究

发布时间:2020-04-14 07:22
【摘要】:机构是指拥有共同目标的社会实体。作为信息资源的发布者,科研评价的统计单位,信息检索的重要字段,知识导航的代表性要素,机构实体在信息组织方面发挥着重要的作用。机构实体数量繁多,层次关系复杂,名称形式各异,衍化多样。在关联数据的蓬勃发展的背景下,不同来源的机构实体的组织方式不一,揭示粒度有别,方向各有侧重,展示形式各异,范围多有重叠。加剧了数据之间的异构性和分散程度,使得辨析机构的唯一性成为棘手的难题,给以机构为中心的信息检索,文献计量,知识导航带来了困难,大大地增加了机构驱动的数据挖掘的成本。本体是一种重要的维护语义的工具,能够使用定义好的词汇表,以标准化和有意义的方式表达资源之间的链接,揭示机构实体之间已有的和隐含的关联网络。构建机构本体对于解决数据异构问题、揭示关联关系网络、发现隐含知识、科研成果正确归属等方面都有重要的理论意义与实践意义。本文基于Wikidata和DBpedia知识库对机构本体的构建展开了理论和实证研究,围绕机构本体构建流程从以下几个方面展开:(1)机构本体属性和类的定义。作为构建机构本体的基础,选择机构实体数量丰富的Wikidata和DBpedia知识库中的机构属性进行属性对齐,提出并实现了基于WordNet的属性对齐方法,根据两大知识库的机构属性融合结果总结机构本体应该包含的属性,根据对象属性的定义域和值域分析机构本体中必需的类。遵循词表复用的原则,建立机构本体的数据字典。(2)提出机构类的概念体系的构建方法。提取Wikidata知识库中以subclass of属性和instance of属性相关联的机构类,根据上下位类的传递性构成机构类目范畴树,运用统计分析的方法对提取的机构类目范畴树进行分析,发现机构类目范畴树存在的问题,并针对存在的问题设计优化框架。以优化后的机构类目范畴树作为机构本体中机构类的概念分类体系。(3)运用Protégé工具将构建的机构本体模型形式化,在本体模型的基础上添加实例,结合OWL向下兼容的性质,提出将表格形式的数据转换成语义化的RDF格式的数据,以实现机构实例的批量导入和机构本体知识库的完善,从而验证机构本体的有效性。
【图文】:

示意图,机构类,实体类,类目


图 4.3 机构类实体与其他实体类重叠示意图目范畴树中类目从属多造成类目层级混乱父类的二级类目中,有 11 个条目的额外父类是处于机的条目。将这些条目按照它们各自的 subclassof 属性整

示意图,示意图,类型属性,优化方法


图4.4层级混乱示意图
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G254

【相似文献】

相关期刊论文 前6条

1 贾君枝;叶壮壮;;基于潜在语义索引的Wikidata机构实体聚类研究[J];数据分析与知识发现;2019年10期

2 贾君枝;叶壮壮;;基于Wikidata的机构类目范畴树构建与优化[J];国家图书馆学刊;2018年01期

3 王瑞云;贾君枝;;基于准马尔可夫过程的Wikidata职业类的层次关系分析[J];情报学报;2017年03期

4 贾君枝;赵宇飞;;Wikidata与名称规范档数据聚合实现[J];情报科学;2018年11期

5 贾君枝;崔西燕;;Wikidata属性特征及关系分析[J];情报科学;2019年06期

6 贾君枝;冯婕;;基于因果链求解算法的人物关系挖掘研究——以Wikidata知识库为例[J];情报学报;2017年03期

相关硕士学位论文 前1条

1 叶壮壮;基于Wikidata的机构本体构建研究[D];山西大学;2019年



本文编号:2627040

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2627040.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户44c34***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com