当前位置:主页 > 科技论文 > 测绘论文 >

面向地球系统科学数据共享的数据推荐研究

发布时间:2020-08-12 23:52
【摘要】:地球系统科学是典型的数据密集型学科,主要研究地球各圈层和子系统间相互作用中的规律和机理,学科相关研究需要使用交叉学科、跨区域、多尺度的综合数据,在地球系统科学领域开展数据共享可以对数据进行有效挖掘利用,促进学术交流与合作。随着地学大数据时代和新地理信息时代的来临,信息获取技术的发展使得学科相关的研究数据呈现出爆炸性增长的趋势,同时互联网技术的发展使得越来越多的互联网用户能够参与到地球系统科学数据共享等地学相关的网络空间信息服务中。数据量的增加和用户群体的扩大,导致了地球系统科学共享过程中过量的数据量超出了用户可以接受的程度,用户难以在海量数据中寻找自己所需要的信息与数据,出现“数据过载”问题。因此在地球系统科学数据共享过程中,研究如何准确高效地获取数据,并设计数据推荐方法,无论是对于专业研究人员还是普通大众都具有重要意义。针对地球系统科学数据进行推荐方法的设计,需要解决以下关键问题:首先,地球系统科学数据具有数据量大、结构异构、信息多元复杂的特点,使用传统的推荐方式进行数据推荐时需要对待推荐对象的特征进行统一描述,使用在结构上同构的方式对地球系统科学数据进行描述时存在困难。其次,地球系统科学数据间关系复杂,用户的需求多样,基于数据属性或用户行为的单一推荐方法难以满足用户对数据的具体需求,需要从多角度设计推荐方法。最后,地球系统科学数据共享平台用户数量多,包含的数据量庞大,用户反馈信息绝大多数为隐性反馈,不包含用户对数据的具体态度,基于这些反馈信息建立的用户-数据关系表中呈现出高维、稀疏、异构且包含冗余信息和噪声的特点,需要结合学科特点研究如何利用这些用户反馈信息开展数据推荐研究。基于上述问题,本文从数据特征和用户需求两个方面着手,在地球系统科学数据共享过程中开展推数据荐研究,取得了如下主要成果:1.面向数据推荐对地球系统科学数据的特征进行描述。地球系统科学数据海量、异构、繁杂,不适合使用单一同构的方式进行特征描述。本文通过分析地球系统科学数据的特点以及用户在研究过程中对数据的具体需求,基于元数据标准从共享数据的元数据中提取了描述数据特征的关键信息,并进行层次化表达,从数据本身角度描述地球系统科学数据特征,为基于内容的推荐方法的设计提供必要支撑。2.使用用户的隐性反馈对数据进行聚类。在用户历史行为数据的基础上,引入复杂网络概念分析数据共享网络的特点,设计使用隐性反馈信息得出数据间的相似性的方法,并在此基础上对研究数据按照研究专题进行聚类,从用户的角度描述地球系统科学数据特征,为基于研究专题的推荐方法设计提供数据基础。3.使用数据本身的特征和用户反馈中归纳的研究专题共同进行推荐。通过对比地球系统科学数据推荐与电子商务领域推荐的异同点,在基于数据内容进行特征提取和基于用户反馈信息进行研究专题聚类的基础上,设计基于数据特征以及基于研究专题的推荐方法,并比较两种方法的性能,实现两种方法的结合。基于上述研究成果,选择国家地球系统科学数据共享平台——长三角科学数据中心的数据为研究对象,提出推荐结果检验标准,开展数据推荐试验。试验结果证明了地球系统科学数据个性化推荐系统的可行性,证明本文提出的地球系统科学数据个性化推荐算法能够较为有效地在地球系统科学数据共享过程中根据用户的偏好进行数据推荐,在一定程度上缓解地球系统科学数据共享中存在的“数据过载”问题,并为其他相关研究提供借鉴。
【学位授予单位】:南京师范大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:P208
【图文】:

专用标准,元数据,国家标准


图2-2地理信息元数据专用标准构成[39]逡逑

信息模块,元数据,数据共享,内容


图24地球系统科学数据共享元数据内容信息模块逡逑数据从属学科和主题分类,记录在元数据内容信息模块中的数据集分类学科按照《中华人民共和国学科分类与代码国家标准》(GB/T邋13745-199

专题地图,元数据,共享数据,特征参数


?邋Tt邋TemperalExtensionType邋?;逡逑0二邋QD逡逑图24地球系统科学数据共享元数据内容信息模块逡逑数据从属学科和主题分类,记录在元数据内容信息模块中的数据集分类信息逡逑内,学科按照《中华人民共和国学科分类与代码国家标准》(GB/T邋13745-1992)逡逑划分,使用58个一级学科中的地球科学、生物学、农学、林学、畜牧学、测绘逡逑科学技术、水利工程、环境科学技术、社会学等九个一级学科中的33个二级学逡逑科,构成了地球系统科学数据共享平台的学科分类。数据主题分类标准按照逡逑GCMD标准中的科学关键词层次体系修改改编而来,分为大气圈、陆地表层、逡逑自然环境、日地空间环境与天文、陆地水圈、海洋、古环境、极地、冰冻圈、固逡逑体地球和基础数据(遥感数据与遥感产品,专题地图,野外台站观测数据)II逡逑个类别。数据主题分类模式的主要建立目的是实现数据快速检索,通过规范的主逡逑题分类词表

【参考文献】

相关期刊论文 前10条

1 侯志伟;诸云强;高星;潘鹏;罗侃;王东旭;;时间本体及其在地学数据检索中的应用[J];地球信息科学学报;2015年04期

2 诸云强;孙九林;王卷乐;杨雅萍;;论地球数据科学与共享[J];国土资源信息化;2015年01期

3 周敏;汪新庆;;基于非规范化和数据字典的地学元数据管理[J];计算机技术与发展;2015年03期

4 程学旗;靳小龙;王元卓;郭嘉丰;张铁赢;李国杰;;大数据系统和分析技术综述[J];软件学报;2014年09期

5 郭华东;王力哲;陈方;梁栋;;科学大数据与数字地球[J];科学通报;2014年12期

6 何清;李宁;罗文娟;史忠植;;大数据下的机器学习算法综述[J];模式识别与人工智能;2014年04期

7 孟祥武;王凡;史艳翠;张玉洁;;移动用户需求获取技术及其应用[J];软件学报;2014年03期

8 游毅;成全;;基于关联数据的科研数据资源共享[J];情报杂志;2012年10期

9 苗立志;李振龙;李晶;杨超伟;;基于OPeNDAP的地球科学数据共享原型系统与应用[J];南京邮电大学学报(自然科学版);2012年01期

10 韩冰;路来君;;地学G~4I系统中空间元数据的设计技术[J];世界地质;2011年02期

相关博士学位论文 前1条

1 陈苗;海量地学数据查询优化关键技术的研究[D];吉林大学;2008年

相关硕士学位论文 前1条

1 邴欣;机器学习在推荐系统中的应用[D];山东大学;2016年



本文编号:2791202

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/2791202.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1a1ae***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com