当前位置:主页 > 社科论文 > 图书档案论文 >

关联数据的词表重用策略研究

发布时间:2020-11-21 16:09
   随着关联开放数据的使用越来越多,数据提供者不仅要将其数据集发布为LOD,且在发布过程中需要将数据集以易于处理的方式进行建模,这样使得数据更具人性化即易于用户理解、查询和使用且易于计算机及关联数据应用程序处理。而关联数据的最佳实践之一,就是在数据建模的过程中重复使用已有词表,即重用现有词表中的类和属性,采用其中的规范术语表示数据或通过术语链接不同的数据集。重用词表能够有效地提高数据集的互操作性,避免不必要的资源浪费;同时还可以最大限度的保证关联数据与已有数据集的语义一致性,便于其被通用关联数据应用程序直接消费,而无需进行映射等处理过程。但在实践中,由于可重用词表的数量不断增长,各词表质量层次不齐,数据发布者无法完全掌握所有的词表以及词表内的术语;其次,由于数据发布者自身领域专业性等原因,难以准确及快速地决定选用哪些词表描述数据的语义。因此对于如何重用词表的服务需求增加,在数据建模过程中,如何根据数据发布者的需求确定重用词表的策略,这涉及词表的数量、与建模领域的匹配度、词表的流行或通用程度、发布词表的机构、词表的维护情况等多重因素。因而本文对关联数据的词表重用策略进行了理论探讨和实证研究,主要围绕以下几个方面开展:(1)介绍了关联数据的四大原则及三大特征,详细探讨了关联数据的发布流程,从数据准备及定义URI、选用词表、建立RDF链接以及数据的Web发布和开放查询逐一展开,分析数据发布流程中词表使用的必要性。(2)界定了词表的定义,对现有的词表查询服务进行了总结和简单介绍,在此基础上提出了关联数据的词表重用流程,探讨了影响其重用的各个影响因素,包括词表的质量、词表的管理及数据发布者等三方面。(3)通过对关联开放数据云中数据集的介绍,引入了出版类数据集,将其进行分类并对其词表重用类别情况、词表重用影响因素及RDF谓词使用情况进行统计分析;然后据此剖析了目前的词表重用策略,包括选用广泛使用的或标准的词表、重用同一词表、词表数量最大化及最小化等,并对每一策略的特点进行了探讨。
【学位单位】:山西大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:G254
【部分图文】:

词表,日志,基本元,语种


关联数据的词表重用策略研究个词表,其存档了所有词表自首次发布以来的各种版本,可以不访问词表网站而直接浏览及使用,还可以在LOV网站访问其修订日志。它提供了多种类型的搜索方式,既可以通过词表名称进行查询,亦可以通过术语查询其所在的词表,检索结果的排序算法基于在 LOD 数据集和 LOV 生态系统中的术语流行度计算。

通配符,逻辑运算,关键字,用户使用


以及使用该词表的数据集数量。对于词表的表达方式和标签也进行了展示,表达方式包括 RDF、RDFS、OWL 等;标签即对词表所属类别进行标识,便于用户进行查找和分类,例如 Methods、Metadata、Society、Biology、People 等。对于数据访问的方法,LOV 提供了多种类型,既可以直接在网站页面的 SPARQL 端点运行查询,还可以通过 LOVAPI,此为访问 LOV 完整功能和数据的便捷方式,用户通过 API 调用实现远程、动态查询词表及其术语等信息,也可以将这些信息获取至本地。3.2.2 SwoogleSwoogle[55](http://swoogle.umbc.edu/2006/)是由马里兰大学开发的基于爬虫的语义 Web 搜索和元数据引擎,适用于互联网上现成可用的所有 RDF 资源,包括各种本体、文档、术语等,如图 3.3 所示。语义 Web 包含了 Web 文档以及与这些文档平行并对其进行描述的语义 Web 文档(Semantic Web Document,SWDs),Swoggle 目前索引了近 130 万个语义 Web 文档,其中包含近 240 万个三元组。其主要利用搜索器系统发现 RDF 文档和内置有 RDF 内容的 HTML 文档,对其进行推理后在数据库中记录和索引文档的元数据。

关联数据的词表重用策略研究


vocab.cc官网
【相似文献】

相关期刊论文 前10条

1 刘竟;吴玲玲;;基于关联数据的学科电子档案资源聚合框架的构建[J];图书情报研究;2019年01期

2 阳广元;;基于关联数据的图书馆服务研究现状与展望[J];图书馆理论与实践;2019年06期

3 王燕红;;国内基于关联数据的资源整合研究述评[J];图书馆理论与实践;2018年06期

4 官维;梁艺多;;航运关联数据的发布及查询应用研究[J];价值工程;2018年33期

5 杨敏;;关联数据在图书馆中的应用研究[J];图书馆研究与工作;2016年05期

6 汪淑娴;;国内关联数据领域研究热点分析[J];时代农机;2016年11期

7 杨选辉;龙帆;;关联数据与本体在图书馆资源服务模式中的应用研究[J];图书馆理论与实践;2016年12期

8 高劲松;程娅;梁艳琪;;基于关联数据的图书馆数字资源语义互联研究[J];情报科学;2017年01期

9 赵龙文;莫荔媛;潘卓齐;;基于关联数据的政府数据开放实现方法研究[J];情报资料工作;2016年06期

10 崔家旺;李春旺;;基于关联数据的类簇语义揭示模型研究[J];数据分析与知识发现;2017年04期


相关博士学位论文 前8条

1 梁艳琪;基于关联数据的文物数字资源语义融合与服务研究[D];华中师范大学;2017年

2 李楠;基于关联数据的知识发现研究[D];中国农业科学院;2012年

3 伍革新;基于关联数据的数字图书馆资源聚合与服务研究[D];华中师范大学;2013年

4 谢铭;关联数据和知识表示的自动语义标注技术[D];武汉大学;2012年

5 鲜国建;农业科技多维语义关联数据构建研究[D];中国农业科学院;2013年

6 郭晓君;关联课程数据组织及知识管理研究[D];武汉大学;2012年

7 袁远明;智慧城市信息系统关键技术研究[D];武汉大学;2012年

8 黄磊;关联课程数据构建及存储方法研究[D];武汉大学;2013年


相关硕士学位论文 前10条

1 张意婷;面向关联信息挖掘的实体案例推荐框架研究[D];上海交通大学;2017年

2 韩洪帅;基于关联数据的传统美术类非遗视频资源语义化组织研究[D];华中师范大学;2019年

3 李捷佳;关联数据的词表重用策略研究[D];山西大学;2019年

4 陈凯;关联数据的异常关系检测[D];上海交通大学;2018年

5 韩雪;基于关联数据的MOOC资源服务模型研究[D];华中师范大学;2018年

6 解迪;SSCMDA:基于间谍刺探策略与超级集群策略的MiRNA与疾病关联预测模型[D];辽宁大学;2018年

7 蒋衍亭;基于关联数据的图书馆知识服务研究[D];华中师范大学;2015年

8 吴红瑶;基于关联数据的科学数据共享模型研究[D];辽宁师范大学;2018年

9 杨东升;基于关联数据的文本型用户生成内容组织研究[D];华中师范大学;2018年

10 莫荔媛;基于关联数据的个性化推荐系统研究[D];华南理工大学;2018年



本文编号:2893264

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2893264.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ed86c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com