政府开放数据的语义描述与实体同一性研究
发布时间:2017-09-12 03:03
本文关键词:政府开放数据的语义描述与实体同一性研究
更多相关文章: 政府数据开放 关联数据 相关性模型 语义描述 实体同一性
【摘要】:伴随着互联网的日益普及和开放数据运动的迅速兴起,智慧城市、信息消费的应用需求越来越多,对政府数据开放的需求也越来越多。政府数据开放就是把政府所掌握的大量原始数据,以“机器可读”的形式,让任何人可免费使用、转化和共享;政府数据开放所开放的数据资源即称为政府开放数据。政府数据开放说易行难,综合对比分析国内外政府数据开放现状,目前我国政府数据开放虽初具数据开放基础,但在宏观层面仍面临数据开放规模较小、数据管理缺乏统一标准等问题;在微观层面,政府到底应该如何开放政府数据?如何描述和发布数据?如何让用户找到并利用这些数据?本文以政府开放数据为研究对象,针对国内政府数据开放所面临的问题和挑战,并以政府开放数据的相关性为基础,基于关联数据对政府开放数据所涉及的两个核心问题即政府开放数据的语义描述和实体同一性问题进行探讨研究。首先,对政府开放数据的相关性进行分析。政府开放数据的相关性体现了数据资源之间固有的关联价值;构建了政府开放数据的相关性四维模型,从不同维度上解析数据相关性类型及价值评价,根据四维模型提出基于关联数据的解决方案,以数据集描述和数据关联发现中实体同一性问题作为解决方案中的核心问题,同时阐述语义描述与实体同一性的因果关系。其次,针对政府开放数据的语义描述问题进行研究。构建政府开放数据的语义描述框架,从描述层、关联层和应用层对政府开放数据进行语义描述分析,将数据集进行分类,按照外部描述和内部描述的方法对数据集进行语义描述,将外部划分为元数据标识信息、数据集标识信息、数据集限制信息和数据集维护信息四类并以领域本体的思想解决数据集内部结构的语义描述问题。最后,对政府开放数据存在的实体同一性问题进行研究,分析实体同一性的类型,并针对政府开放数据从数据集维度来构建实体同一性识别方法流程,具体包括“数据集内部结构识别?构建索引文件?共指实体识别”,在实体识别过程中提出一种基于属性和属性值相似度计算的数据实体同一性判定方法,并利用真实政府开放数据进行方法验证,成功识别数据集中共指实体,突出了研究的可行性;同时对实验结果进行解析,总结方法的不足之处。
【关键词】:政府数据开放 关联数据 相关性模型 语义描述 实体同一性
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:D523
【目录】:
- 摘要5-6
- Abstract6-11
- 第一章 绪论11-28
- 1.1 研究背景和意义11-19
- 1.1.1 研究背景11-19
- 1.1.2 研究意义19
- 1.2 国内外研究现状19-24
- 1.2.1 政府数据开放研究现状19-22
- 1.2.2 语义描述研究现状22-23
- 1.2.3 实体同一性研究现状23-24
- 1.3 研究内容和创新点24-28
- 1.3.1 论文框架24-26
- 1.3.2 研究内容26
- 1.3.3 创新点26-28
- 第二章 政府开放数据概述28-37
- 2.1 政府开放数据相关概念28-32
- 2.1.1 政府信息公开28-29
- 2.1.2 政府开放数据29-32
- 2.2 关联数据32-35
- 2.2.1 基本概念和发布原则32-33
- 2.2.2 基本架构和应用模式33-35
- 2.3 关联政府开放数据的意义35-36
- 2.4 本章小结36-37
- 第三章 政府开放数据的相关性四维模型37-48
- 3.1 政府开放数据的相关性37-38
- 3.1.1 相关性基本概念37-38
- 3.1.2 相关性理论模型38
- 3.2 政府开放数据的相关性四维模型构建38-44
- 3.2.1 相关性四维模型构建38-42
- 3.2.2 相关性类型解析42-44
- 3.3 政府开放数据的相关性价值评价44-46
- 3.3.1 相关性价值体现44-45
- 3.3.2 相关性价值评价45-46
- 3.4 政府开放数据的相关性四维模型解决方案46-47
- 3.4.1 关联数据解决方案46
- 3.4.2 关联数据化——语义描述46-47
- 3.4.3 关联发现——实体同一性47
- 3.5 本章小结47-48
- 第四章 政府开放数据的语义描述研究48-69
- 4.1 相关元数据标准48-50
- 4.1.1 政府信息定位服务48-49
- 4.1.2 都柏林核心政府元数据49
- 4.1.3 互联数据集词汇表49-50
- 4.2 政府开放数据语义描述框架50-61
- 4.2.1 框架构建51
- 4.2.2 描述层51-59
- 4.2.3 关联层59-60
- 4.2.4 应用层60-61
- 4.3 政府开放数据语义描述实例分析61-68
- 4.3.1 相关词汇选择62-63
- 4.3.2 结构化数据集描述63-66
- 4.3.3 非结构化数据集描述66-68
- 4.4 本章小结68-69
- 第五章 政府开放数据的实体同一性研究69-86
- 5.1 实体同一性概述69-73
- 5.1.1 概念界定69-70
- 5.1.2 实体同一性类别70-73
- 5.2 政府开放数据实体同一性判断流程73-78
- 5.2.1 流程构建73-77
- 5.2.2 关键步骤77-78
- 5.3 政府开放数据实体同一性实例分析78-84
- 5.3.1 数据集的选取和转换78-80
- 5.3.2 数据实体识别80-84
- 5.3.3 实验结果分析84
- 5.4 本章小结84-86
- 总结与展望86-88
- 参考文献88-92
- 攻读硕士学位期间取得的研究成果92-93
- 致谢93-94
- 附件94
【参考文献】
中国期刊全文数据库 前10条
1 吴e,
本文编号:834665
本文链接:https://www.wllwen.com/shekelunwen/guojizhengzhilunwen/834665.html