云计算环境下海量GML空间数据存储索引机制研究
本文选题:GML + 云计算 ; 参考:《江西理工大学》2013年硕士论文
【摘要】:GML作为一种地理信息编码规范,不断的被完善及广泛应用于数据交换、数据集成、数据发布、数据存储、数据管理、移动GIS及基于位置服务(LBS)等领域,因此大量的GML空间数据不断涌现;另一方面,随着地理信息领域求解问题的规模化、复杂化,对计算平台的存储和计算能力提出了更高的要求。传统的单机环境在管理、处理海量GML空间数据时遇到很大的瓶颈。近年来,在学术界兴起的云计算技术,为GML空间数据的高效管理和处理提供了一个新思路。如何在云计算环境下高效存储管理和应用海量的GML空间数据,已经成为当前的热点问题。而对空间数据进行合理组织,设计高效的空间索引,是空间查询及空间分析等一切应用的基础。因此,本文对云计算环境下海量GML空间数据存储索引机制进行研究有重要的意义。 本文以现有GML存储管理理论为基础,研究在云计算环境下GML空间数据的存储和索引建立方面理论。借助开源云计算平台Hadoop进行实现和效率测试。主要研究内容包括以下几个方面。 1)深入研究GML空间数据模型、数据特点并且与传统空间数据进行比较。深入研究云计算相关原理与技术,为在云计算环境下存储管理GML空间数据奠定理论基础。 2)借用Hadoop开源云计算平台,深入研究其HDFS(分布式文件系统)、MapReduce并行编程框架及架构在分布式文件系统上的列数据库HBase,针对GML空间数据半结构化的特点,提出了一种GML空间数据在HBase中的存储的数据模型。为了验证HBase数据库分布式存储的性能,本文在不同节点数的集群环境下对数据写入HBase速度进行测试,实验证明,随着节点数的增多,数据写入速度加快。并且与传统数据库做了对比实验,结果证明,,在大数据量的情况下,HBase并行存储GML空间数据,比传统空间数据库有更大的性能优势。 3)研究探索云计算环境下的GML空间数据的并行空间索引:本文结合现有的空间数据划分策略及并行空间索引算法,提出一种适合GML空间数据的划分策略并在此基础上设计了一种多层并行空间索引结构。最后,进行了简单的空间范围查询实验,在不同查询边界和不同节点数的方案下测试索引的查询效率。结果证明,本文提出的并行索引体系在空间查询方面具有较好的性能。
[Abstract]:As a kind of geographic information coding standard , it has been perfected and widely used in data exchange , data integration , data distribution , data storage , data management , mobile GIS and location service ( LBS ) .
On the other hand , with the scale and complexity of solving the problem in the field of geographic information , the storage and computing power of the computing platform is more demanding . The traditional single - machine environment has a great bottleneck in the management and processing of the large amount of data . In recent years , the cloud computing technology in the academic circle has provided a new idea for the efficient management and processing of the spatial data .
In this paper , based on the existing storage management theory , the paper studies the theory of the storage and indexing of the spatial data based on the cloud computing environment . The realization and efficiency test are carried out with the help of the open source cloud computing platform Hadoop . The main research contents include the following aspects .
1 ) In - depth study of the spatial data model , data characteristics and comparison with the traditional spatial data .
In order to verify the distributed storage performance of HBase database , this paper presents a data model for data writing in HBase . In order to verify the distributed storage performance of HBase database , this paper presents a data model for data writing in HBase under cluster environment with different nodes .
3 ) Research and explore the parallel spatial index of spatial data in the cloud computing environment : combining with the existing spatial data partitioning strategy and the parallel space index algorithm , this paper proposes a multi - layer parallel spatial index structure . Finally , a simple spatial range query experiment is carried out , and the query efficiency of the index is tested under the schemes of different query boundaries and different nodes .
【学位授予单位】:江西理工大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333;P208
【参考文献】
相关期刊论文 前10条
1 李建卓;;云计算及其发展综述[J];宝鸡文理学院学报(自然科学版);2010年03期
2 宋爱琪;宋德香;刘晓红;王美君;;基于空间相邻关系的GML点对象聚类算法研究[J];测绘标准化;2011年01期
3 兰小机,张书亮,刘德儿,闾国年;GML空间数据库系统研究[J];测绘科学;2005年05期
4 兰小机;张建峰;邓华梅;;GML空间数据在Oracle中的存储研究[J];测绘科学;2009年02期
5 兰小机;苏健强;张卫国;;db4o引擎下的GML空间数据存储研究[J];测绘科学;2010年03期
6 赵园春;李成名;赵春宇;;基于R树的分布式并行空间索引机制研究[J];地理与地理信息科学;2007年06期
7 程莹;张云勇;房秉毅;徐雷;;云计算时代的数据库研究[J];电信技术;2011年01期
8 房秉毅;张云勇;程莹;徐雷;;云计算国内外发展现状分析[J];电信科学;2010年S1期
9 兰小机;闾国年;姜永发;张书亮;陈方林;;基于GML的空间数据建模研究[J];工程勘察;2004年06期
10 贾婷;魏祖宽;唐曙光;金在弘;;一种面向并行空间查询的数据划分方法[J];计算机科学;2010年08期
相关博士学位论文 前2条
1 康俊锋;云计算环境下高分辨率遥感影像存储与高效管理技术研究[D];浙江大学;2011年
2 陈建华;原生模式GML空间数据管理机制研究[D];成都理工大学;2008年
本文编号:2101221
本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/2101221.html