当前位置:主页 > 管理论文 > 物流管理论文 >

基于NoSQL的海量航空物流数据分布式存储研究

发布时间:2018-03-28 22:24

  本文选题:航空物流 切入点:海量小文件 出处:《中国民航大学》2017年硕士论文


【摘要】:航空物流信息系统是民航重要的系统,承载着频繁的数据交换、数据存储等任务,其数据大多以海量小文件形式存在。海量小文件由于种类繁多、数据规模较大,其存储问题已经成为工业界的难题。目前,大多企业使用分布式文件系统HDFS存储数据,然而HDFS是专门解决大文件存储问题设计的,对海量小文件的存储,面临着存储效率不高、内存占用量大、单点故障、磁盘空间利用率低等诸多问题。因此,研究航空物流海量小文件的分布式存储方法尤为重要。本文首先根据HDFS在存储海量小文件存在的诸多问题,分析了航空物流关键数据及其特征,提出了航空物流海量小文件优化存储方法,包括小文件的合并过程、预取机制、永久化方法,考虑文件之间的相关性,提高文件的存储和访问效率,考虑文件的时效性,提高磁盘空间的利用率。其次,通过组合优化存储方法,进而提出一种基于NoSQL的海量航空物流数据分布式多级存储架构,使用NoSQL内存式数据库Redis作缓存级,HDFS作数据的活跃级和永久级,数据的写入、数据的访问和数据永久化操作相互独立,降低了模块之间的耦合性;使Redis部署到HDFS的DataNode节点构成集群,减少HDFS中NameNode的单点内存压力,提升并发性能和索引检索速度,保持了元数据服务的可扩展性。最后,通过海量航空物流数据分布式存储实验与分析,该研究方法对海量小文件的存取效率有明显地提升,在顺序访问情况下,访问时间在160毫秒左右,同时减少了磁盘的空间占用,可节省79%左右的磁盘空间。
[Abstract]:Aviation logistics information system is an important system of civil aviation, carrying frequent data exchange, data storage and other tasks, its data mostly exist in the form of a large number of small files. At present, most enterprises use distributed file system (HDFS) to store data. However, HDFS is specially designed to solve the problem of large file storage. Therefore, it is very important to study the distributed storage method of large amount of small files in aeronautical logistics. Firstly, according to the problems existing in storing large amount of small files in HDFS, there are many problems in the storage of large numbers of small files in this paper, such as large amount of memory, single point failure, low utilization of disk space and so on. This paper analyzes the key data and its characteristics of aviation logistics, and puts forward the optimized storage method of large amount of small files in aviation logistics, including the merging process of small files, prefetching mechanism, permanence method and considering the correlation between files. Improve the efficiency of file storage and access, consider the timeliness of files, improve the utilization of disk space. Secondly, by combining and optimizing storage method, we propose a distributed multi-level storage architecture of massive aviation logistics data based on NoSQL. The NoSQL memory database Redis is used as the buffer level and Redis as the active and permanent level of data. The data writing, data accessing and data permanence operation are independent of each other, which reduces the coupling between modules. Redis is deployed to the DataNode nodes of HDFS to form a cluster, which reduces the single point memory pressure of NameNode in HDFS, improves concurrent performance and index retrieval speed, and maintains the extensibility of metadata services. Through the distributed storage experiment and analysis of massive aviation logistics data, this research method can obviously improve the access efficiency of large amount of small files. In the case of sequential access, the access time is about 160 milliseconds, and the space occupied by the disk is reduced at the same time. Can save about 79% of disk space.
【学位授予单位】:中国民航大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP333;TP311.13

【参考文献】

相关期刊论文 前10条

1 张守利;杨冬菊;韩燕波;;一种面向海量小文件的文件接收和存储优化方案[J];小型微型计算机系统;2015年08期

2 张璐;杨东芳;;数据库中小文件的实时存储与优化[J];河南科技;2015年05期

3 李铁;燕彩蓉;黄永锋;宋亚龙;;面向Hadoop分布式文件系统的小文件存取优化方法[J];计算机应用;2014年11期

4 张海;马建红;;基于HDFS的小文件存储与读取优化策略[J];计算机系统应用;2014年05期

5 罗军;陈席林;李文生;;高效Key-Value持久化缓存系统的实现[J];计算机工程;2014年03期

6 赵跃龙;谢晓玲;蔡咏才;王国华;刘霖;;一种性能优化的小文件存储访问策略的研究[J];计算机研究与发展;2012年07期

7 董继光;陈卫卫;田浪军;吴海佳;;大规模云存储系统副本布局研究[J];计算机应用;2012年03期

8 黄贤立;;NoSQL非关系型数据库的发展及应用初探[J];福建电脑;2010年07期

9 李思莉;李娟;;XML文档到关系数据库的映射策略[J];计算机工程;2010年05期

10 朱珊娜;李书琴;安福定;;XML文档到关系数据库的转换研究[J];计算机工程与设计;2008年21期

相关硕士学位论文 前7条

1 焦冰露;面向航空物流海量数据的订阅分发算法研究[D];中国民航大学;2016年

2 左大鹏;Hadoop小文件存储管理的研究与实现[D];北京交通大学;2015年

3 李慧莹;基于HDFS的小文件存储方法的研究与优化[D];西安电子科技大学;2014年

4 陈光景;Hadoop小文件处理技术的研究和实现[D];南京邮电大学;2013年

5 蔡睿诚;基于HDFS的小文件处理与相关MapReduce计算模型性能的优化与改进[D];吉林大学;2012年

6 李宽;基于HDFS的分布式Namenode节点模型的研究[D];华南理工大学;2011年

7 泰冬雪;基于Hadoop的海量小文件处理方法的研究[D];辽宁大学;2011年



本文编号:1678351

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/wuliuguanlilunwen/1678351.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fdddb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com