地震数据存储系统研究
本文选题:SDFS 切入点:地震数据 出处:《中国科学技术大学》2015年硕士论文
【摘要】:近年来,得益于人类社会对石油的需求,石油勘探技术也在飞速发展。地震勘探是进行石油勘探的主要的方法,随着地震勘探技术在地震数据采集、资料处理和资料解释方面不断创新,地震勘探所产生的数据也在海量增长。目前,人们针对这些海量的数据计算发展了高性能计算,使得地震数据处理速度越来越快,但是地震数据处理过程中数据读取的I0瓶颈严重阻碍了数据的处理速度。因此,如何提高地震数据的读取速度成了一个亟待解决的问题。目前针对地震数据10瓶颈的问题,做法多是采用分布式文件系统作为存储系统。每种分布式文件系统的存储特点是不一样的,如HDFS适合大文件的存储,并且对大文件读取进行了优化,又如Fast DFS适合小文件的存储。而地震数据的读取特点是块小量大,即读取的粒度小但读取量大。目前的分布式系统并没有与地震数据读取特点相吻合的读取模式,因而地震数据读取的10瓶颈问题仍存在。本文通过研究地震数据处理的主要数据格式SEGY的格式特点以及一般地震数据的处理流程,分析出目前地震数据处理遇到10瓶颈的原因,实现了一种基于Fast DFS的地震数据存储系统即SDFS(Seismic Data File System)系统。该系统实现了解决地震数据读取10瓶颈的方案。该方案为:首先,通过将地震数据文件以道为单位的分块存储,提高了数据的读取效率;其次,通过将文件宏块再分块,并使用并行磁盘读取技术来提高了地震数据的读取速度;最后还提出了针对系统数据储可靠性的研究,即通过完整备份的方式增加系统可靠性。为了证明该方案的有效性,本文实现了 SDFS系统并对系统的主要功能进行了设计,然后进行了两组地震数据读取的实验。实验一测试了并行磁盘读取技术的有效性,实验结果显示,当每个节点硬盘数据量增加时系统的读取性能增加,速度几乎与磁盘数量成正比;当数据块大小增加时,对顺序读有利而减小则对随机读有利。实验二则用对比实验的方式进行了系统的读取性能测试,对比的系统为Fast DFS,测试结果为SDFS系统的顺序读和随机读性能都要明显优于Fast DFS。综合两次实验结果可知,本文提出的SDFS系统能够帮助改善地震数据读取的10性能。
[Abstract]:In recent years, petroleum exploration technology has been developing rapidly because of the demand for oil in human society. Seismic exploration is the main method of petroleum exploration, and with seismic exploration technology in seismic data acquisition, Data processing and data interpretation are constantly innovating, and the data generated by seismic exploration are also increasing. At present, people have developed high-performance computing for these massive data calculations, which has made seismic data processing faster and faster. However, in the process of seismic data processing, the I _ 0 bottleneck of data reading seriously hinders the speed of data processing. Therefore, how to improve the speed of seismic data reading has become a problem to be solved. Distributed file system is used as storage system. The storage characteristics of each distributed file system are different. For example, HDFS is suitable for large file storage, and the large file reading is optimized. For example, Fast DFS is suitable for the storage of small files. However, the reading of seismic data is characterized by a small number of blocks, that is, small granularity but large amount of reading. The current distributed system does not have a reading mode consistent with the characteristics of seismic data reading. Therefore, the 10-bottleneck problem of seismic data reading still exists. By studying the format characteristics of SEGY, the main data format of seismic data processing and the processing flow of general seismic data, this paper analyzes the causes of the 10 bottleneck in seismic data processing. A seismic data storage system based on Fast DFS, that is, SDFS(Seismic Data File system, is implemented in this system, which solves the 10 bottleneck problem of seismic data reading. The scheme is as follows: firstly, the seismic data file is stored in blocks with trace as the unit. The efficiency of data reading is improved. Secondly, the read speed of seismic data is improved by dividing the macro blocks of files into blocks and using parallel disk reading technology. Finally, the research on the reliability of data storage in the system is put forward. In order to prove the validity of the scheme, the SDFS system is realized and the main functions of the system are designed. Then two groups of seismic data reading experiments are carried out. Experiment 1 tests the effectiveness of the parallel disk reading technology. The experimental results show that the reading performance of the system increases with the increase of hard disk data at each node. The speed is almost proportional to the number of disks; when the size of the data block increases, it is advantageous to read at random while it is beneficial to sequential reading. The compared system is Fast DFS.The test results show that the sequential and random reading performance of SDFS system is obviously better than that of Fast DFS.The results of two experiments show that the SDFS system presented in this paper can help to improve the 10 performance of seismic data reading.
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:P631.43;TP333
【相似文献】
相关期刊论文 前10条
1 李二补;;数据存储系统中可靠性及容错性研究[J];山西科技;2010年01期
2 王冰冰;;数据存储系统安全浅析[J];科技广场;2012年04期
3 林磊;利用超导涡旋的数据存储系统[J];物理;1982年04期
4 沈兆龙;江兵;蔡建文;徐敏;黄文浩;;双光头多层数据存储系统同步聚焦误差检测[J];光学学报;2007年04期
5 ;南安普顿大学研究人员开发永久性数据存储系统[J];中国光学;2014年02期
6 刘鹏曦;许王燕;;一种冗余地理数据存储系统[J];大众科技;2014年01期
7 姚乾;严华;;YAFFS在雨水情遥测终端数据存储系统中的改进[J];人民长江;2013年17期
8 张舟斌;左维;李春来;;基于SAN的绕月探测工程数据存储系统架构的设计与实现[J];天文研究与技术;2007年04期
9 马庆锋;王芳;;基于CF卡的数据存储系统设计[J];山东科学;2008年03期
10 卢雪萍;任沙浦;;基于SDRAM的视频数据存储系统设计[J];绍兴文理学院学报(自然科学版);2009年03期
相关会议论文 前10条
1 江杨;;流数据存储系统体系结构研究[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
2 章政海;;电厂数据存储系统总体构架研究[A];二○○九年全国电力企业信息化大会论文集[C];2009年
3 李非;邱天爽;迟戈;魏晶;;高速数据存储在CT成像系统中的应用研究[A];2008年医疗仪器学术年会暨理事会论文汇编[C];2008年
4 孙伟家;符力耘;;基于炮域单程波偏移的角度域共成像点道集方法研究[A];中国地球物理学会第二十七届年会论文集[C];2011年
5 朱莉;李振春;;角度域共成像点道集的提取与叠加成像[A];中国地球物理学会第二十四届年会论文集[C];2008年
6 徐嘉亮;常旭;王一博;;角道集剩余深度对于剩余速度的敏感性分析[A];中国地球物理2013——第二十二专题论文集[C];2013年
7 王文龙;印兴耀;张广智;;基于射线理论的角度道集提取方法研究[A];中国地球物理学会第二十七届年会论文集[C];2011年
8 王园园;李振春;;复杂地质条件下角度域共成像点道集提取方法[A];中国地球物理学会第二十七届年会论文集[C];2011年
9 陈生昌;Wu Ru-Shan;;波动方程角度域共成像道集[A];中国地球物理学会第22届年会论文集[C];2006年
10 王海宁;姚陈;蔡明刚;;陆地反射PS波不同轴道集方法的静校问题[A];中国地球物理2010——中国地球物理学会第二十六届年会、中国地震学会第十三次学术大会论文集[C];2010年
相关重要报纸文章 前10条
1 惠闻;SAN应用不再难[N];网络世界;2000年
2 ;SAN——高瞻者的选择[N];网络世界;2001年
3 ;传统存储方式 面临变革[N];中国计算机报;2004年
4 ;突破存储的极限[N];中国电脑教育报;2004年
5 ;惠普简化行业数据存储系统[N];人民邮电;2005年
6 ;青岛大学医学院附属医 Centera 应用案例[N];中国电子报;2005年
7 陈旭兵;岳阳医院“分级存储”PACS构建[N];网络世界;2008年
8 程鸿;政府信息资源需层次化管理[N];计算机世界;2004年
9 刘燕;福建采购工商管理系统信息建设项目[N];政府采购信息报;2008年
10 IBM存储事业部 张英伟;用逻辑卷镜像安全备份[N];中国计算机报;2006年
相关博士学位论文 前3条
1 陈海霞;计算机数据存储系统中读写头/盘间超薄气膜动力稳定性研究[D];华中科技大学;2004年
2 刘守伟;角度域共成像点道集及偏移速度分析[D];同济大学;2007年
3 符云辉;《诸儒鸣道集》述评[D];复旦大学;2007年
相关硕士学位论文 前10条
1 林潘榕;基于连接顺序优化的分布式能耗数据存储系统的研究与实现[D];华南理工大学;2015年
2 朱伟健;基于数据属性的大数据存储系统研究与实现[D];华南理工大学;2015年
3 马浩田;基于HBase的嵌套式数据存储系统设计与实现[D];浙江大学;2015年
4 夏云;非结构化大数据存储系统安全性增强技术研究[D];电子科技大学;2015年
5 李启芳;成工职校校园网络数据存储系统的设计与应用[D];电子科技大学;2014年
6 韩亮;手机售后维修管理及其数据存储系统的设计与实现[D];吉林大学;2016年
7 单若琦;一种基于OpenTSDB的海量实时数据存储系统[D];华南理工大学;2016年
8 徐迪迪;面向分布式数据存储系统可靠性的评估与增强技术研究[D];西安电子科技大学;2015年
9 刘松;基于分布式的海量图片数据存储系统的研究与设计[D];深圳大学;2016年
10 黎沛春;面向大数据存储系统的故障检测技术研究[D];华南理工大学;2016年
,本文编号:1658107
本文链接:https://www.wllwen.com/kejilunwen/diqiudizhi/1658107.html