当前位置:主页 > 科技论文 > 计算机论文 >

云计算环境下GML空间数据存储索引机制研究

发布时间:2018-01-03 06:29

  本文关键词:云计算环境下GML空间数据存储索引机制研究 出处:《江西理工大学》2012年硕士论文 论文类型:学位论文


  更多相关文章: 云计算 GML 空间数据划分 分布式存储 Hadoop平台


【摘要】:GML是基于XML对空间数据进行的编码,并为GIS领域和各企业广泛接受,是目前网络空间信息的重要组成部分。随着信息技术的发展,空间信息量急剧的增加;如何对GML空间数据进行有效的存储和管理成了影响GML发展的关键问题。依据GML空间数据自身的特性(地域分布性),使用集中式的存储不利于对空间数据的统一管理和访问;而云存储是一种商业化实现的分布式存储;它是将一些廉价计算机的空闲资源集中起来,共同分担海量数据的分布式存储和管理任务的。所以,对GML空间数据采用分布式存储和管理是一个比较好的方案。 针对海量GML空间数据如何进行有效的存储,主要进行了以下几方面的研究及创新点分析: 首先,需要对空间数据进行合理的划分,既要考虑空间数据多维的特性,,又要考虑其空间关系和拓扑关系等;对几种空间数据划分进行分析过后,又对Hilbert曲线层次分解算法和GML矢量图层分割的空间数据划分进行了研究,提出了对GML空间要素图层的划分并结合Hilbert曲线层次划分快速编码的方法对空间要素对象进行划分处理;在具体的应用中,参照分布式存储系统中各子节点的信息对要素对象进行分块划分,并分配相应子节点的空闲资源进行分布式存储; 其次,在云计算环境下对分布式数据库的设计,结合GML空间数据的特征和Hadoop平台的主从式架构,对各主从服务器节点所存储的相关表结构、数据类型等进行了设计。针对分布式存储的GML空间数据的索引机制和索引结构表也进行了分析研究,主要研究了QR树的特性和对GML索引的构建; 最后,在Hadoop开源平台的主从式架构下对分布式存储的原型系统进行了设计和部分实现,并通过实验对单机存储和分布式存储的效率及其查询访问的效率进行了比较分析,得出了对海量的GML空间数据无论是在存储还是查询访问,分布式计算机集群的处理效率都高于单机的处理效率。 创新点主要有通过Hilbert曲线对GML空间数据采用要素队列的划分方法;结合hadoop平台对GML数据的并行空间索引机制的创建及各子节点索引结构表的设计;GML空间数据分布式存储流程的设计;云存储系统功能设计与实现等。
[Abstract]:GML is the XML of spatial data based on the encoding, and widely accepted as the GIS field and the enterprise, is an important part of spatial information network. With the development of information technology, the spatial information quantity increases sharply; how to effectively store and pipe of GML spatial data management has become the key issues affecting the development of GML. According to the characteristics of GML spatial data itself (regional distribution), the use of centralized storage is not conducive to the unified management and access of spatial data; and the cloud storage is a commercial implementation of distributed storage; it is free of some cheap computer resources together and share the distributed storage and management of massive data task. So, the spatial data of GML using distributed storage and management is a better solution.
In view of how to store the massive GML spatial data effectively, the following research and innovation are mainly carried out in the following aspects:
First of all, the need for a reasonable division of spatial data, it is necessary to consider the characteristics of spatial data cube, but also consider the spatial relations and topological relations; to analyze the data of several space division after Hilbert curve hierarchical decomposition of spatial data partitioning algorithm and GML layer were studied. The proposed division of GML the elements of space and layer method combined with the Hilbert curve hierarchy division fast encoding processing for space object elements; in the specific application, divided the elements of object for each sub node according to the information in the distributed storage system, distributed storage resources and free distribution of the corresponding child node;
Secondly, design and calculation of distributed database in the cloud environment, combined with the master-slave architecture of GML spatial data and the characteristics of Hadoop platform, the table structure of the master-slave server nodes stored, data types are designed. The distributed memory GML spatial data indexing mechanism and index structure of table analysis of the characteristics, mainly studies the QR tree and the GML index construction;
Finally, in the master-slave architecture of the Hadoop open-source platform under the prototype system of distributed storage has been designed and partially implemented, and make a comparison through experiments on the efficiency of single storage and distributed storage and query efficiency, the GML spatial data in the mass both in storage access and query efficiency of distributed processing the computer cluster is higher than single processing efficiency.
The main innovation division method by using factor queue for GML spatial data through the Hilbert curve; design and create sub node index structure table with the Hadoop platform of GML data parallel spatial indexing mechanism; design of GML spatial data distributed storage process; cloud storage and realize the functional design of the system.

【学位授予单位】:江西理工大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP333

【参考文献】

相关期刊论文 前10条

1 任金铜;;基于GML空间数据结构的GMLGIS研究[J];测绘标准化;2009年04期

2 兰小机,张书亮,刘德儿,闾国年;GML空间数据库系统研究[J];测绘科学;2005年05期

3 兰小机;张建峰;邓华梅;;GML空间数据在Oracle中的存储研究[J];测绘科学;2009年02期

4 张立朝;吕蓬;王建明;申正宇;李强;李遵强;;基于GML的空间数据库设计与数据存储研究[J];测绘通报;2008年03期

5 周艳;朱庆;张叶廷;;基于Hilbert曲线层次分解的空间数据划分方法[J];地理与地理信息科学;2007年04期

6 李骁;范冲;邹峥嵘;;空间数据存储模式的比较研究[J];工程地质计算机应用;2009年02期

7 吴绍忠;李靖;;基于云计算架构的公安情报信息平台建设研究[J];中国人民公安大学学报(自然科学版);2010年03期

8 孟令奎;张文;;分布式空间数据库的动态负载平衡算法[J];计算机工程;2008年11期

9 邱建华,唐学兵,黄华国;一种基于四叉树和R~*-树的索引结构——QR~*-树[J];计算机应用;2003年08期

10 高波;郭朝珍;丁善镜;;基于GML矢量图层分割的空间数据分布式协同处理的研究[J];计算机应用;2009年01期

相关博士学位论文 前2条

1 赵春宇;高性能并行GIS中矢量空间数据存取与处理关键技术研究[D];武汉大学;2006年

2 陈建华;原生模式GML空间数据管理机制研究[D];成都理工大学;2008年

相关硕士学位论文 前10条

1 王海波;云计算中数据库的关键问题研究与实现[D];吉林大学;2011年

2 周一可;云计算下MapReduce编程模型可用性的研究与优化[D];上海交通大学;2011年

3 霍树民;基于Hadoop的海量影像数据管理关键技术研究[D];国防科学技术大学;2010年

4 金松昌;基于HDFS的多用户并行文件IO的设计与实现[D];国防科学技术大学;2010年

5 朱珠;基于Hadoop的海量数据处理模型研究和应用[D];北京邮电大学;2008年

6 马冬青;基于Oracle XML DB技术的GML数据存储研究[D];中南大学;2008年

7 纪俊;一种基于云计算的数据挖掘平台架构设计与实现[D];青岛大学;2009年

8 邓自立;云计算中的网络拓扑设计和Hadoop平台研究[D];中国科学技术大学;2009年

9 肖辉辉;GML空间数据存储研究[D];江西理工大学;2009年

10 李云桃;基于Hadoop的海量数据处理系统的设计与实现[D];哈尔滨工业大学;2009年



本文编号:1372785

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1372785.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户052da***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com