当前位置:主页 > 科技论文 > 计算机论文 >

云计算环境下海量空间数据高效存储关键技术研究

发布时间:2018-06-23 21:26

  本文选题:海量空间数据存储 + 空间数据存储模型 ; 参考:《武汉大学》2012年博士论文


【摘要】:随着国民经济的发展和技术的进步,空间数据的应用早 突破专业领域的限制,在国土、资源、环境、交通和规划等众多领域的应用日益广泛。“智慧地球”、“智慧中国”和“智慧城市”等的建设更是极大拓展了空间数据的应用范围。由于对地观测技术的飞速发展,空间数据的获取手段日益丰富,空间数据呈几何倍数增加。迅速增加的空间数据在容量、性能、可用性和扩展性等方面对存储系统提出了更高的要求。现有的空间数据库大多在关系数据库之上构建,随着数据量的激增,大多出现了扩展性差、并发读写能力低和数据结构变更困难等问题,难以满足当前空间数据的应用需求。本文提出了运用云计算,特别是NoSQL数据库技术构建海量空问数据的存储来解决上述问题。具体来说,论文的主要研究工作如下: (1)针对海量空间数据服务在容量、扩展性等方面的要求,设计了一种可扩展的海量空间数据存储服务体系结构和服务模型。海量空间数据存储服务体系采用分层结构,每一层均采用分布式集群方式构建,因而具有良好的扩展性。分布式消息队列被应用到空间数据服务之中,以降低耦合度,提高扩展能力,并对瞬时激增的请求进行缓冲;分布式缓存用来减少复杂的空间数据存取逻辑和计算逻辑,降低请求延迟。空间数据服务模型被设计用来简化服务的开发和部署。鉴于空问数据服务涉及的数据量较大、资源消耗较多,空间数据服务采用单调服务模式构建。 (2)提出了基于Redis构建分布式内存缓存和消息队列的方法。分布式内存缓存Redis-RCache和消息队列Redis-RMQ均在以一致性哈希算法为基础的Redis集群之上构建。结合缓存在空间数据中的应用场景,为Redis-RCache设计了缓存项结构,缓存一致性策略和替换算法等。结合消息队列的典型应用场景,为Redis-RMQ设计了消息结构、消息可见性策略、有毒消息处理机制和消息的生命周期。为解决一致性哈希集群环境下无法保持消息先后顺序的问题,Redis-RMQ通过全局队列存储消息的顺序和状态,并同时实现了先进先出队列和优先级队列。 (3)设计了列式存储环境下海量空间数据的存储模型及其空间数据引擎。列式存储模型下的空间数据按照数据集组-数据集-数据描述-数据块的方式组织数据。空间数据采用分块的方式存储在集群中,提高了空间数据的并发读写能力。本文设计了固定字节长度分块、图形范围分块和要素分块三种空间数据划分策略。通过建立列式存储与空间数据模型问的映射关系,为该空间数据模型所设计的空间数据引擎实现了业务逻辑与底层存储结构的分离。 (4)针对列式存储环境下空问查询困难以及索引区域变化容易导致索引重建的问题,提出了一种分布式可扩展四叉树索引DAE-QTree及其空间查询方法。通过将整个空间范围划分为一系列的网格,并每个网格建立四义树索引,DAE-QTree索引实现了索引区域的扩展。空间对象记录在能容纳该对象的最小四叉树结点上其索引编码使用四叉树结点编码及四叉树所在网格的编码共同构造。通过将索引分散存储在Cassandra集群中,DAE-QTree实现了大索引记录情况下的快速定位。结合DAE-QTree的索引原理和编码方式以及经典的两步空间查询方法,本文为DAE-QTree设计了列式存储环境下的空间查询方法。
[Abstract]:With the development of national economy and the progress of technology , the application of spatial data is more and more extensive in many fields such as land , resources , environment , transportation and planning .

( 1 ) In view of the requirements of mass spatial data service in capacity and expansibility , a scalable mass spatial data storage service architecture and service model is designed . The massive spatial data storage service system adopts a hierarchical structure , each layer is constructed in a distributed cluster mode , thus having good expansibility . The distributed message queue is applied to the space data service to reduce the coupling degree , improve the expansion capability , and buffer the request for transient surge ;
Distributed cache is used to reduce the complex spatial data access logic and computational logic , reduce the request delay . The space data service model is designed to simplify the development and deployment of the service . In view of the large amount of data involved in the empty Q data service , the resource consumption is more , and the spatial data service is constructed in a monotonic service mode .

( 2 ) Redis - RCache and Message Queuing Redis - RMQ are constructed on the basis of a consistent hash algorithm . The distributed memory cache Redis - RCache and the Message Queuing Redis - RMQ are constructed on the basis of a consistent hash algorithm . In combination with the typical application scenario of the buffer in the spatial data , the message structure , message visibility strategy , toxic message processing mechanism and lifecycle of the message are designed for the Redis - RMQ . In order to solve the problem that the message is not kept in the order of messages in a consistent hash cluster environment , the Redis - RMQ stores the order and status of the message through the global queue , and realizes the first - in - first - out queue and the priority queue at the same time .

( 3 ) The storage model of mass spatial data and its spatial data engine under the storage environment are designed . The spatial data in the storage model organizes the data according to the data set - data set - data description - data block .

( 4 ) In view of the difficulty of empty query query and index region change easily lead to the problem of index reconstruction , a distributed extensible quadtree index DAE - QTree and its spatial query method are proposed .
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:P208;TP333

【参考文献】

相关期刊论文 前6条

1 周艳;朱庆;张叶廷;;基于Hilbert曲线层次分解的空间数据划分方法[J];地理与地理信息科学;2007年04期

2 刘异;呙维;江万寿;龚健雅;;一种基于云计算模型的遥感处理服务模式研究与实现[J];计算机应用研究;2009年09期

3 陈国良;孙广中;徐云;龙柏;;并行计算的一体化研究现状与发展趋势[J];科学通报;2009年08期

4 朱欣焰;周春辉;呙维;夏宇;;分布式空间数据分片与跨边界拓扑连接优化方法[J];软件学报;2011年02期

5 宋海朝,杨钰,周俭;分布式空间数据库的研究与设计[J];计算机工程与设计;2004年11期

6 承达瑜;陈军;韩刚;王发良;;基于消息队列的实时GIS协同操作研究[J];中国矿业大学学报;2012年01期

相关博士学位论文 前1条

1 何雄;空间数据库引擎关键技术研究[D];中国科学院研究生院(计算技术研究所);2006年



本文编号:2058490

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2058490.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户997a4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com