当前位置:主页 > 科技论文 > 计算机论文 >

云环境中的移动文件存储和时空数据分析关键技术研究

发布时间:2018-09-11 07:08
【摘要】:云计算是近年来蓬勃发展的一个重要领域。云计算环境下的海量数据存储、管理与分析存在诸多挑战,其中时空数据存储访问和应用分析已成为云环境下数据研究的重要方向。一方面,随着个人数字终端的普及,移动设备势必成为数字化社会中数据的重要来源。移动设备产生的数据往往具有时空特性,如何为移动设备提供便捷的海量时空数据存储访问机制是云计算环境下数据管理的一大关键问题。另一方面,复杂的时空数据特性势必成为影响数据分析的关键因素,如何为时空数据提供准确而高效的应用分析能力是云计算环境下数据管理的又一关键问题。本文针对时空数据管理和数据分析展开深入研究,主要解决移动设备访问异构云存储资源效率不高、使用不方便等问题,克服时空数据使用过程中数据不精确、数据量庞大等因素带来的挑战。本文的研究工作和创新点如下: (1)提出了一种基于文件系统的异构云存储服务无缝统一访问方法Wukong。 目前不同的云存储服务访问接口各异,由于缺乏无缝访问多种云存储服务的统一接口,,时空数据应用不能够不加修改地直接访问和使用后端云存储数据。文件系统是被应用程序广泛支持的一种数据使用接口,以文件系统接口封装各种云存储服务可以保证应用程序对异构云存储服务的直接访问。本文首次提出了一种基于文件系统的异构云存储服务无缝统一访问方法Wukong文件系统。Wukong通过异构服务接口抽象封装技术,实现了对多种云存储服务的一致化管理,保证时空数据应用对异构云存储服务的统一访问。Wukong通过基于桥接模式的接口封装技术,实现了云存储访问接口到文件系统接口的转换,保证时空数据应用程序对云存储服务的透明访问。针对移动环境,本文通过自适应压缩及离线服务伪装等优化技术,降低了系统对网络环境的要求,保证移动设备在不同环境下对云存储服务的有效访问。 (2)提出了一种支持多数据视图的跨设备文件同步机制EaSync。 由于个人数字设备日益普及,人们往往拥有多个设备。在时空数据应用使用、收集数据过程中,设备之间的数据可以相互辅助应用,例如设备可以使用采集的GPS数据来修正地图数据,也可以使用地图数据来进一步提高采集得到的GPS数据的精度等。因此,多个设备之间数据的透明同步服务有利于为时空数据应用提供更好的支撑与保障。但是,由于设备用途及处理能力不同,各种设备所需要且能处理的文件集合(即数据视图)存在差异,如何为多个设备提供异构的数据视图是同步服务的一大挑战。针对数据同步服务面临的设备种类众多、数据视图变化快、视图差异大等问题,本文提出了一种支持多数据视图的跨设备文件同步机制EaSync。EaSync通过基于时间戳的文件同步机制,保证数据跨设备访问的一致性,实现了数据在服务端与多个设备端之间的同步存储。EaSync通过基于树型结构的视图组织方式,实现了差异视图的层次化管理,解决了数据视图更新快、差异大的问题。 (3)提出了一种基于传统地图匹配算法的交互式真实路径发现方法。 随着各类交通信息服务需求的不断增长,智能交通系统在社会生活中日趋重要。构建有效的智能交通系统依赖于大量的GPS时空数据,而原始GPS数据存在精度不高的问题。地图匹配算法是用来提高数据精度的常用方法,但是传统的地图匹配算法存在真实路径缺失的问题。本文提出了一种交互式的真实路径发现方法TruthFinder,通过人工评估调整与传统地图匹配算法相结合的路径发现技术,从历史轨迹数据中准确地发掘出真实路径信息,解决传统地图匹配算法真实路径缺失的问题。本文通过基于用户操作次数统计的开销模型分析,提出了地图匹配算法自主选择与人为误差有效避免等的优化策略,实现了大规模真实路径的快速生成。实验分析表明,TruthFinder在保证生成的真实路径的精度的同时,降低了人工操作的评估与调整开销,提高了真实路径的发现效率。 (4)提出了面向时空数据的并行化索引创建和并行化数据聚类分析方法。 随着时空数据的不断增长,现有的索引创建方法与聚类分析算法已无法处理当前庞大的数据集合,针对大规模时空数据的索引创建与聚类分析是海量时空数据挖掘的重大难题。本文提出了面向时空数据的并行化索引创建和并行化数据聚类分析方法。通过基于MapReduce模型的并行化处理框架,本文实现了时空数据索引的自底向上打包创建,解决了传统索引创建方法面对海量时空数据所带来的主存容量有限、处理周期过长甚至无法处理的问题;本文提出了并行的DBScan聚类分析算法,解决了大规模时空数据聚类分析中数据分区困难、局部分簇合并复杂的问题,为时空大数据的处理提供了技术基础。通过实验分析表明,我们的并行化方法在保证数据处理性能的同时具良好的可扩展性,解决了数据量庞大、计算复杂所带来的主存容量受限、处理周期过长等问题。 通过以上四方面研究,我们为云计算环境下的海量数据存储、管理与分析提供了有力的技术支撑。
[Abstract]:Cloud computing is an important area of vigorous development in recent years. There are many challenges in mass data storage, management and analysis in cloud computing environment. Access to spatio-temporal data storage and application analysis have become an important direction of data research in cloud environment. On the one hand, with the popularity of personal digital terminals, mobile devices are bound to become digital. Data generated by mobile devices are often spatio-temporal. How to provide a convenient storage and access mechanism for massive spatio-temporal data for mobile devices is a key issue for data management in cloud computing environment. How to provide accurate and efficient application analysis capability for spatio-temporal data is another key problem of data management in cloud computing environment. In this paper, spatio-temporal data management and data analysis are deeply studied, mainly to solve the problems of inefficient access to heterogeneous cloud storage resources by mobile devices, inconvenient use, and to overcome the over-use of spatio-temporal data. The research work and innovation of this paper are as follows:1.
(1) a seamless unified access method for heterogeneous cloud storage service based on file system is proposed. Wukong.
At present, different cloud storage services have different access interfaces. Due to the lack of a unified interface for seamless access to various cloud storage services, spatio-temporal data applications can not directly access and use back-end cloud storage data without modification. File system is a widely supported data usage interface by applications, encapsulating various kinds of data with file system interfaces. Cloud storage services can guarantee direct access to heterogeneous cloud storage services by applications. In this paper, a seamless and unified access method for heterogeneous cloud storage services based on file system, Wukong file system, is proposed for the first time. Wukong realizes the transformation from cloud storage access interface to file system interface by using the interface encapsulation technology based on bridge mode to ensure transparent access to cloud storage services by spatio-temporal data applications. The installation optimization technology reduces the requirement of the system to the network environment and guarantees the effective access to cloud storage services by mobile devices in different environments.
(2) a cross file synchronization mechanism for multi data views is proposed, EaSync..
Because of the popularity of personal digital devices, people often have multiple devices. In the process of collecting data, the data between devices can be used to assist each other. For example, the devices can use the collected GPS data to correct the map data, and can also use the map data to further improve the collected GPS data. Therefore, transparent data synchronization services between multiple devices can provide better support and protection for spatio-temporal data applications. However, due to different device uses and processing capabilities, various devices need and can process different sets of files (i.e. data views), how to provide heterogeneous data views for multiple devices This paper proposes a cross-device file synchronization mechanism, EaSync.EaSync, which supports multi-data views to ensure consistency of data access across devices through a timestamp-based file synchronization mechanism. It realizes the synchronous storage of data between the server and multiple devices. EaSync realizes the hierarchical management of different views by organizing views based on tree structure, and solves the problem of fast updating of data views and large differences.
(3) an interactive real path discovery method based on traditional map matching algorithm is proposed.
Intelligent Transportation System (ITS) is becoming more and more important in social life with the increasing demand for various kinds of traffic information services. Constructing an effective ITS relies on a large number of GPS spatio-temporal data, while the original GPS data has the problem of low accuracy. Map matching algorithm is a common method to improve the accuracy of data, but the traditional map map. TruthFinder, an interactive real path discovery method, is proposed in this paper, which combines manual evaluation and adjustment with traditional map matching algorithm to accurately extract real path information from historical track data and solve the real path of traditional map matching algorithm. By analyzing the cost model based on the statistics of user's operation times, this paper proposes the optimization strategy of map matching algorithm, such as autonomous selection and effective avoidance of human error, to realize the fast generation of large-scale real paths. The evaluation and adjustment cost of manual operation improves the discovery efficiency of real path.
(4) put forward parallel index creation and parallel data clustering analysis method for spatiotemporal data.
With the continuous growth of spatio-temporal data, the existing index creation methods and clustering analysis algorithms can not deal with the current huge data set. For large-scale spatio-temporal data, index creation and clustering analysis is a major problem in massive spatio-temporal data mining. According to the clustering analysis method, through the parallel processing framework based on MapReduce model, this paper realizes the bottom-up packing of spatio-temporal data index creation, and solves the problem that traditional index creation methods face the massive spatio-temporal data, such as limited main memory capacity, long processing cycle and even unable to process. An clustering analysis algorithm solves the problems of data partitioning and local clustering and merging in large-scale spatio-temporal data clustering analysis, and provides a technical basis for large-scale spatio-temporal data processing. The experimental results show that our parallelization method has good scalability while guaranteeing the performance of data processing, and solves the problem of large-scale data. The complexity of the main memory and the long processing cycle caused by the large computation complexity.
Through the above four aspects of research, we provide a strong technical support for mass data storage, management and analysis in the cloud computing environment.
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP333;TP311.13

【共引文献】

相关期刊论文 前10条

1 李恩学;蔡荣海;;基于IME6400的MPEG-4嵌入式视频监控系统实现[J];安防科技;2009年12期

2 李勇;嵌入式Linux集成开发环境的研究[J];安阳师范学院学报;2005年05期

3 吴晓勇,曾家智;操作系统内核中动态内存分配机制的研究[J];成都信息工程学院学报;2005年01期

4 王昊;张钟澍;;一种改进的Linux实时进程调度算法——RAD算法[J];成都信息工程学院学报;2009年03期

5 陈小兰;杨斌;;多处理器平台下Linux 2.6启动过程中的位图分析[J];成都信息工程学院学报;2010年01期

6 张科;杨斌;;Linux内核交互式和非交互式进程判别算法的质疑[J];成都信息工程学院学报;2010年02期

7 许继彦;杜钦生;;红外通信模块的设计与实现[J];长春大学学报;2009年10期

8 邹秋艳;徐红云;;基于Linux2.6的进程隐藏机制的实现[J];重庆理工大学学报(自然科学版);2010年05期

9 林娜;李志;王斌;;一种综合地图匹配算法的设计与实现[J];测绘科学;2008年02期

10 马海波;李少杰;黄跃峰;滕寿威;;车载导航系统的高精度定位算法[J];地理信息世界;2010年01期

相关会议论文 前7条

1 马海波;黄跃峰;滕寿威;;车载导航系统的高精度定位算法[A];2009`中国地理信息产业论坛暨第二届教育论坛就业洽谈会论文集[C];2009年

2 赵旭;夏靖波;王哲;;Linux内核进程调度的研究与改进[A];第三届全国嵌入式技术和信息处理联合学术会议论文集[C];2009年

3 韩中波;徐大专;;多通道超声波探伤系统软件设计与实现[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅲ)[C];2008年

4 姚玉坤;乔彬;;嵌入式操作系统内存管理机制研究与改进[A];2009中国仪器仪表与测控技术大会论文集[C];2009年

5 苏海滨;徐俊红;程志冲;;基于权重的改进综合地图匹配算法[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年

6 张奕然;郭承军;;一种基于GPS和地图匹配的车辆导航轨迹偏差修正算法[A];第五届中国卫星导航学术年会论文集-S9 组合导航与导航新方法[C];2014年

7 祁昊颖;;大数据时代电信运营商文件系统新思考[A];2013年中国信息通信研究新进展论文集[C];2014年

相关博士学位论文 前10条

1 刘润涛;基于序的空间数据索引及查询算法研究[D];哈尔滨理工大学;2009年

2 孟江涛;Xen虚拟机研究[D];电子科技大学;2010年

3 陈雯;基于本体框架的交通出行语义轨迹建模、标记及数据库研究[D];华东师范大学;2011年

4 韩志刚;地理超媒体数据模型及Web服务研究[D];河南大学;2011年

5 刘有贵;GPS/GPRS车辆定位网络系统及故障在线检测技术研究[D];长春理工大学;2011年

6 毛佳;嵌入式实时系统中关键技术的研究[D];吉林大学;2004年

7 刘劲松;关于存储系统性能的测试、仿真与评价的研究[D];华中科技大学;2004年

8 邓玉辉;基于网络磁盘阵列的海量信息存储系统[D];华中科技大学;2004年

9 柳林;移动终端导航系统中地图匹配技术的研究与应用[D];山东科技大学;2007年

10 李海山;面向恢复的容错计算技术研究[D];哈尔滨工程大学;2007年

相关硕士学位论文 前10条

1 卞传旭;基于TOS架构的防火墙性能研究与改进[D];山东科技大学;2010年

2 张宪华;基于嵌入式Linux的系统构建及桌面应用程序研究[D];山东科技大学;2010年

3 崔运涛;基于ARM+DSP的捷联航姿系统设计[D];哈尔滨工程大学;2010年

4 黄宇;嵌入式多模态生物特征识别系统设计[D];哈尔滨工程大学;2010年

5 蒙会民;基于嵌入式平台的电梯监控系统的设计与研究[D];大连海事大学;2010年

6 步东伟;稻米质量国家标准参数智能化测试仪的研制[D];河南工业大学;2010年

7 王韬;基于Linux路由器的P2P流量识别控制系统的设计与实现[D];苏州大学;2010年

8 杨泽明;WLAN环境下的入侵检测防御系统的设计与实现[D];苏州大学;2010年

9 徐向前;基于Linux的嵌入式路由器软件的设计与实现[D];苏州大学;2010年

10 张闯;基于ARM/GPRS的远程水文监测终端设计[D];哈尔滨理工大学;2010年



本文编号:2235972

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2235972.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户34d26***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com