当前位置:主页 > 社科论文 > 图书档案论文 >

科研实体名称规范的关联数据模型构建

发布时间:2020-12-07 18:46
  [目的/意义]旨在研究将国家科技图书文献中心(National Science and Technology Library,NSTL)的科研实体名称规范数据发布为关联数据的难点——关联数据的数据模型。科研实体名称规范数据的数据模型研究,有助于NSTL科研实体数据的共享、互联、质量提升,融入到互联网中,同时也为其他机构使用、发布关联数据提供模型参考。[方法/过程]首先,分析比较国内外关联数据发布项目中所采用的数据模型,发现关联数据发布项目中的数据模型主要分为以Schema.org为核心和多种标准词表组合两类;结合NSTL名称规范数据的特点,设计两种形式的关联数据模型,并从关联数据模型对名称规范数据的表达程度、模型复杂度等角度进行比较,选择较优方案;最后以D2RQ为工具进行实验,将NSTL名称规范的样例数据发布为关联数据。[结果/结论]分析发现两种方案中以Schema.org为核心标准词表的方案相对于多种标准词表组合的方案有较优的表达完整度、较低的模型复杂度,更易于融入互联网,因此更适合作为NSTL名称规范数据的关联数据模型。 

【文章来源】:图书情报工作. 2020年10期 第109-117页 北大核心CSSCI

【文章页数】:9 页

【部分图文】:

科研实体名称规范的关联数据模型构建


名称规范数据抽象模型

词表,核心词,方案


分类统计两种方案未能表达的元素和属性,结果见图3。左边柱形表示Schema.org为核心词表方案未能表达的元素和属性,右边表示多词表组合方案。总体上来说,多词表组合方案未能表达的名称规范数据元素和属性均高于Schema.org为核心词表方案。因此在对规范数据的表达完整程度上,以Schema.org为核心词表方案优于多词表组合方案。另外在模型复杂度上,Schema.org为核心词表方案以Schema.org为核心标准词表配合基金标准词表FRAPO,相比于由4种标准词表混合的多词表组合方案来说,模型复杂度更低,更易与外部数据关联,也更易于更新和维护。

模型图,关联数据,名称规范,数据集


此外,Schema.org中的“Schema:sameAs”可以将本地的规范数据与外部的数据集连接,如DBpedia、VIAF。5 科研实体关联数据发布实验

【参考文献】:
期刊论文
[1]文献编目:从数字化到数据化[J]. 胡小菁.  中国图书馆学报. 2019(03)
[2]中文个人名称规范文档的关联数据化研究[J]. 贾君枝,石燕青.  情报学报. 2016 (07)
[3]网络书目资源描述规范SchemaBibEx及其应用[J]. 张雪松,谈海蓉,姚湘中.  图书馆杂志. 2016(05)
[4]万维网时代的规范控制[J]. 刘炜,张春景,夏翠娟.  中国图书馆学报. 2015(03)
[5]基于海量数字资源的科研关系网络构建探究[J]. 曾建勋.  情报学报. 2013 (09)

硕士论文
[1]基于关联数据的科研关系揭示研究[D]. 李柏炀.东北师范大学 2016



本文编号:2903729

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2903729.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户111ae***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com