当前位置:主页 > 科技论文 > 测绘论文 >

云计算环境下空间大数据存储索引机制研究

发布时间:2020-03-18 21:53
【摘要】:大数据时代的到来,使得空间数据正在以前所未有的速度增长,并呈现出多源、多尺度、多时相、全球覆盖和高分辨率特征,GIS在生活中的广泛应用,用户数量变得越来越庞大,空间实时检索与获取在不断增多,而空间数据作为GIS的“血液”,如何对其进行合理的存储管理才能满足GIS用户的需求值得进一步探索。云计算的发展使得Hadoop和MapReduce在处理空间大数据的并行存取与处理等问题上得到了充分的应用,特别适用于空间大数据的并行存取与处理,因此,针对空间数据数据量大、存在拓扑与语义关系、更新频繁等特点,需要利用Hadoop平台,对空间大数据设计一种合理的空间数据结构进行存储,并构建高效的索引。本文利用云计算平台Hadoop、分布式数据库HBase、分布式计算模型MapReduce研究空间大数据的存储索引机制,并以OSM空间数据为例,完成了以下3个方面的研究:(1)分析OSM空间数据的结构和特点,针对空间大数据在云计算环境下的管理需求,设计空间数据存储模型和增量数据组织方式。同时为保证地理要素几何完整性以及拓扑关系完整性,将HDFS现有的副本放置策略进行改进并研究适合空间数据的数据副本放置策略。(2)对于空间大数据,为解决其空间分布不均、保证空间数据的相邻性等问题,经对比分析常见的空间数据划分策略后,提出基于STR树的空间数据划分策略,同时为了提高空间数据的索引效率和分析性能,利用MapReduce技术进行并行划分。(3)分析传统空间索引机制的优缺点,对划分好的空间数据,根据地理实体要素的分布排序以自下而上的方式利用R-树进行局部索引的构建,然后再根据STR树构建全局索引,将局部索引与全局索引的信息分别存储在DataNode和NameNode上,以此来提高空间数据检索效率。最后,部署Hadoop分布式环境,以OSM数据为例进行测试分析,对比在数据量及集群节点个数不同的情况下空间数据的存储和查询性能,验证了分布式环境下空间数据的存储和索引都具有良好的性能,能够满足空间数据存储和检索的需求。
【图文】:

项目结构


op 简介op 是由 Apache Lucene 创始人 Doug Cutting 创建,起源于开源的网络cene,因此也是 Lucene 的一部分。Doug Cutting 在创建 Hadoop 过程单好记,具有一定的个性,不易于与其他项目重名,因此他将自己取的名字作为该项目的名字,生动有趣,并将这种风格继续沿用下去后续模块也是如此,如 Pig。用 Hadoop 云平台,可以实现对规模庞大的数据进行有效的分布式op 主要是为了解决 Nutch 中的可扩展性问题,而现在已经发展成为源软件,具有数十个具有强大生命力的子项目,可以利用一般情况PC 机搭建集群环境,实现对大数据的管理。Hadoop 平台的出现,,其扩展容易、处理效率高、容错性好、所需成本低等许多非常明显的常方便快捷地部署和使用,并实现对大数据的处理和挖掘。

架构图,架构,分布式文件系统


图 2.2 HDFS 架构图DFS 分布式文件系统中的节点类型可以分为两种,即元数据节点(Name节点(DataNode)。NameNode 的存在相当于 HDFS 中的“大管家”,负 中的文件和目录,并把它们作为命名空间镜像文件和编辑日志文件存储在用者编写的相关信息可以在 HDFS 中有序的被保存起来、进行更新或删NameNode 将分割的不同块指定存储在对应的 DataNode 上。而 DataNode储整个 HDFS 分布式文件系统的文件数据,在 DataNode 启动的时候,它磁盘并将保存在节点上的块信息报告给 NameNode。为了保证 DataNode 之间的联系,DataNode 需要定期发送心跳保持联系,否则认为其已经ameNode 在启动的时候读取 fsimage(NameNode 启动时对整个文件系统dit logs(NameNode 启动后对文件系统的改动序列)合并,把改动写到文
【学位授予单位】:江西理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:P208

【相似文献】

相关期刊论文 前10条

1 杜珍应;唐文学;邓科;;空间数据的挖掘技术及其应用研究[J];工程技术研究;2018年06期

2 陶迎春;刘光;庞京辉;吴爱华;赵凌美;;构建面向个性化服务的特大城市云空间数据中心[J];测绘通报;2017年02期

3 梁其洋;吴保国;赵春江;郝星耀;潘瑜春;;分布式空间数据服务两级检索方法研究[J];地理与地理信息科学;2017年02期

4 ;环球速览[J];卫星与网络;2017年04期

5 王跃;;中国GIS教育发展道路上的屏障[J];科教导刊(中旬刊);2017年09期

6 乐鹏;郭霞;张晨晓;张明达;;空间数据溯源的概念、模型与服务[J];地理与地理信息科学;2015年06期

7 黄佛辉;;WebGIS中空间数据的可视化[J];城市地理;2016年20期

8 李楠;;面向数据成果更新的空间数据制图研究[J];科技资讯;2014年03期

9 王f^;李伟;;空间数据质量的模糊综合评价方法探讨[J];现代测绘;2011年03期

10 李伟芬;丁静;苗卿;;空间数据多尺度研究综述[J];电脑知识与技术(学术交流);2007年13期

相关会议论文 前10条

1 殷江涛;黄阳林;朱怀汝;;数字乡镇基础空间数据的质量控制[A];创新发展——河南省第五届学术年会论文选集[C];2009年

2 杨成韫;荣芳;彭子风;;基于客户/服务器结构的空间数据分布式处理研究[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(上册)[C];2001年

3 陈荦;刘云翔;唐宇;景宁;;基于优先图的空间数据应用服务链建模方法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

4 范爱民;张永彬;;基于误差熵不确定带的空间数据质量评价指标[A];中国煤炭学会矿山测量专业委员会第17届学术会议论文集[C];2000年

5 刘新贵;黄雅娟;;空间数据网络化获取与管理初探[A];中国地理信息系统协会第三次代表大会暨第七届年会论文集[C];2003年

6 孙翠羽;马飞虎;孙建华;张永军;;测绘空间数据元数据管理系统的设计与实现[A];地理空间信息技术及其应用论坛论文集[C];2005年

7 杜红悦;宫辉力;冯克忠;贾建坤;权忠生;;应急救灾空间数据中心建设技术与策略研究[A];第十七届中国遥感大会摘要集[C];2010年

8 温永宁;张红平;闾国年;张宏;陶虹;;基于房产空间数据的楼宇空间疏散路径建模研究[A];全国地质制图与GIS学术论坛论文集[C];2011年

9 王建涛;;空间数据元数据管理与检索系统的构建[A];第四届海峡两岸GIS发展研讨会暨中国GIS协会第十届年会论文集[C];2006年

10 胡克新;周晓光;;地籍空间数据质量检查与修正[A];中国地理信息系统协会第九届年会论文集[C];2005年

相关重要报纸文章 前10条

1 记者 侯建斌 见习记者 梁成栋;网络空间数据法律保护等议题达成新共识[N];法制日报;2019年

2 本报见习记者 曹飞;“核心技术‘买不来’,必须自力更生”[N];解放日报;2017年

3 记者 滕艳;国家地质空间数据网格系统获发明专利[N];地质勘查导报;2009年

4 宁津生 陈军 晁定波;空间数据质量的主要内涵[N];中国测绘报;2002年

5 北京航天泰坦科技股份有限公司总经理 倪金生;空间数据迎来新机遇[N];中国航天报;2016年

6 宁津生 陈军 晁定波;空间数据的质量控制方法[N];中国测绘报;2002年

7 记者 陈龙;航天科工空间数据服务中心成立[N];中国航天报;2016年

8 记者 胡其峰;多项空间数据成果向社会开放[N];光明日报;2013年

9 记者 李永成 王瑜婷;勾画“数字海南”蓝图[N];中国测绘报;2000年

10 林峰;空间数据不确定性理论与方法取得成果[N];科技日报;2005年

相关博士学位论文 前10条

1 袁洁;基于关联数据技术的空间数据溯源共享研究[D];武汉大学;2013年

2 万义良;空间数据质量检查与评估理论研究[D];武汉大学;2015年

3 李玲;嵌入式GIS空间数据多尺度表达与快速显示技术研究[D];东南大学;2018年

4 李世明;林业空间数据平台技术的应用示范研究[D];中国林业科学研究院;2008年

5 陈静;分布式虚拟GIS关键技术研究[D];武汉大学;2004年

6 王卉;无缝GIS相关理论与技术的研究[D];解放军信息工程大学;2004年

7 郭同德;GIS中空间数据位置不确定性的模型与试验研究[D];解放军信息工程大学;2004年

8 连剑波;基于XML的地质数据集成及WebGIS发布研究[D];中国科学院研究生院(广州地球化学研究所);2006年

9 覃如府;中国岩石圈三维结构数据库集成及其管理系统开发研究[D];吉林大学;2006年

10 何勇;GIS过程建模与集成化研究[D];武汉大学;2004年

相关硕士学位论文 前10条

1 于雪润;地学空间数据三维可视化关键算法研究及软件研发[D];合肥工业大学;2019年

2 李雪丽;云计算环境下空间大数据存储索引机制研究[D];江西理工大学;2019年

3 耿东哲;地下空间数据资源管理系统关键技术研究[D];中国石油大学(华东);2017年

4 王忠j;基于Cesium平台的多维地球空间数据可视化[D];华东师范大学;2018年

5 孟彦伟;移动空间数据索引及查询方法研究[D];辽宁大学;2018年

6 杨美菊;基于空间数据的聚类DLIS-R树算法研究[D];昆明理工大学;2018年

7 杨智昊;煤矿空间数据矢量瓦片关键技术研究[D];中国矿业大学;2018年

8 杨坤奎;基于实体密度的位置服务中kNN查询和连接方法研究[D];南京大学;2018年

9 吴珂;基于GPU的空间数据索引与查询技术研究[D];西安电子科技大学;2018年

10 郗雪洁;基于Spark的空间数据可视化关键技术研究[D];西安电子科技大学;2018年



本文编号:2589238

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/2589238.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户24cc0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com