基于关联数据的科技智库数据共享机制研究
发布时间:2020-03-18 02:07
【摘要】:大数据时代下,科技和诸多学科产生交叉,“科技+经济”、“科技+政治”、“科技+健康”等主题层出不穷,多学科交叉导致科技智库数据搜集的难度大大提升。科技智库数据共享就是将科技智库在科研活动中获取到各方面、各领域的高质量原始数据,以“机器可读”的形式,在科技智库、科研院所等以科学研究为目的的组织体系中进行共享利用,促进项目数据的重复利用。科技智库数据共享说易行难,从宏观的角度看,科技智库共享的数据资源涉及多方利益,如政府、企业、公众等,缺乏合理的机制、政策和制度的支撑,无法为数据伦理中涉及到的商业机密、个人隐私等问题匹配解决方案。从微观的角度看,共享数据应以什么样的格式组织,由谁负责管理,如何实现共享数据的统一运营管理,以保证数据的质量和用途,都是目前科技智库数据共享中的难题所在。本文以科技智库共享数据为研究对象,针对其面临的问题与挑战,从宏观和微观两个角度进行相应分析,并提出框架、机制、制度等方面的建议和解决方案。首先,基于科技智库数据共享的实际需求,提出科技图谱的概念。通过利益相关者理论和协同理论,明确共享过程中的利益主体,提出了与科技创新需求相匹配的科技图谱构建服务框架。其次,针对科技智库数据共享中的政策制度问题进行研究。通过界定共享数据的产权归属,明确其主要利益享有者,参照现有的数据流通许可协议,结合科技智库数据共享的实际需求,提出与之相匹配的数据共享许可协议体系,将利益协调和许可协议保障相统一,提出基于利益协调的科技智库支撑服务框架,并从政策、制度方面提出相应建议。最后,对科技智库数据共享中的技术实现方面进行研究。以知识图谱作为共享数据的主要组织形式,探讨在以科学数据中心为统一管理机构的情况下,如何实现对共享数据的构建与维护。结合HTTP、LDN、LDP等技术标准,提出基于通知的服务器交互式的数据管理架构,对数据共享过程中的描述、发布、维护等问题进行重点探讨,并结合案例实验进行分析,突出研究的可行之处。
【图文】:
华南理工大学硕士学位论文科技智库是指专业的政策研究和咨询机构,主要职能是科技战略政策研究和科技支持服务政策制定。从科学技术发展规律的角度出发,科技智库将基于数据支持力求准确的预测未来科技的发展趋势,所支撑的数据范围、数量、质量,与服务内容和服务方式直接相关,也将直接影响决策效果。未来工学研究所(Institute of Future Engineering,IFENG)是日本最为著名的科技决策智库,在 2016 年全球顶级科技决策智库排行中排名第五,从其官网中公开的科研成果中可以看出,以调查、数据分析为主要研究方法的调查研究是科技智库重要研究范式之一,如图 1-1 所示。新一轮的科技革命已经到来产业升级转型不可避免,我们需要科技智库来提前规划好国家科技创新战略格局,努力克服各领域、各部门科技创新活动中存在的“孤岛”、“碎片化”现象,加快建立协同高效的科技创新、科学决策体系。
关于关联数据理论研究主要包括关联数据集的描述、维护、应用等方面。2006 年,Berners Lee 分析了当时网络的发展现状和演化趋势,提出了关联数据的概念,并定义了四大基本原则。2008 年,Tom Heath 总结了关联数据的各种发布方式[13],为关联数据云建设提供了理论支撑。Volz J 等人基于 Silk 框架探讨了数据实体间的关联发现[14]。此外,也有许多学者针对关联数据在不同领域的描述应用进行了探讨,如交通、旅游、图书等领域,,在此就不一一赘述。描述关联数据的 RDF 词表大多沿用复用性程度高的元数据元素表,图 1-2 是图书领域的 RDF 词表标签云图,其中标签的大小直接关系到该词汇集被使用的频率大小[15]。常用的词汇集还有广泛用于政府等公共关联数据集的DCAT[16]和专门用于传感器数据的 SSN[17]。在实体描述时应选取复用程度高、应用范围广的词汇集。选取这样的词汇集,有利于计算机理解其语义,为后续关联和深入挖掘提供便利。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G253
本文编号:2588050
【图文】:
华南理工大学硕士学位论文科技智库是指专业的政策研究和咨询机构,主要职能是科技战略政策研究和科技支持服务政策制定。从科学技术发展规律的角度出发,科技智库将基于数据支持力求准确的预测未来科技的发展趋势,所支撑的数据范围、数量、质量,与服务内容和服务方式直接相关,也将直接影响决策效果。未来工学研究所(Institute of Future Engineering,IFENG)是日本最为著名的科技决策智库,在 2016 年全球顶级科技决策智库排行中排名第五,从其官网中公开的科研成果中可以看出,以调查、数据分析为主要研究方法的调查研究是科技智库重要研究范式之一,如图 1-1 所示。新一轮的科技革命已经到来产业升级转型不可避免,我们需要科技智库来提前规划好国家科技创新战略格局,努力克服各领域、各部门科技创新活动中存在的“孤岛”、“碎片化”现象,加快建立协同高效的科技创新、科学决策体系。
关于关联数据理论研究主要包括关联数据集的描述、维护、应用等方面。2006 年,Berners Lee 分析了当时网络的发展现状和演化趋势,提出了关联数据的概念,并定义了四大基本原则。2008 年,Tom Heath 总结了关联数据的各种发布方式[13],为关联数据云建设提供了理论支撑。Volz J 等人基于 Silk 框架探讨了数据实体间的关联发现[14]。此外,也有许多学者针对关联数据在不同领域的描述应用进行了探讨,如交通、旅游、图书等领域,,在此就不一一赘述。描述关联数据的 RDF 词表大多沿用复用性程度高的元数据元素表,图 1-2 是图书领域的 RDF 词表标签云图,其中标签的大小直接关系到该词汇集被使用的频率大小[15]。常用的词汇集还有广泛用于政府等公共关联数据集的DCAT[16]和专门用于传感器数据的 SSN[17]。在实体描述时应选取复用程度高、应用范围广的词汇集。选取这样的词汇集,有利于计算机理解其语义,为后续关联和深入挖掘提供便利。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G253
【参考文献】
相关期刊论文 前10条
1 张涵;王忠;;国外政府开放数据的比较研究[J];情报杂志;2015年08期
2 李纯;张冬荣;;科技智库的社会经济数据需求及其建设模式案例分析[J];图书情报工作;2015年11期
3 吴育良;;国外智库信息服务的分析及启示[J];情报杂志;2015年02期
4 曹明;刘兰兰;;社科型智库信息化建设评价指标体系研究[J];中州大学学报;2014年05期
5 贾丽梅;郑志蕴;李钝;王振飞;;基于动态权值的关联数据语义相似度算法研究[J];计算机科学;2014年08期
6 王萍;傅泽禄;;数据驱动决策系统:大数据时代美国学校改进的有力工具[J];中国电化教育;2014年07期
7 郭少友;闫振斌;;动态关联数据:概念、要求与实现机制[J];图书馆学研究;2014年09期
8 陈大庆;;英国科研资助机构的数据管理与共享政策调查及启示[J];图书情报工作;2013年08期
9 唐艺;谢守美;;基于协同学理论的高校图书馆嵌入式服务研究[J];图书情报工作;2013年08期
10 姜恩波;董霞;;关联数据链接维护技术介绍[J];图书馆杂志;2013年02期
相关硕士学位论文 前1条
1 陈明艳;政府开放数据的语义描述与实体同一性研究[D];华南理工大学;2015年
本文编号:2588050
本文链接:https://www.wllwen.com/tushudanganlunwen/2588050.html
教材专著