闪存数据库系统存储管理及可裁剪性研究
本文选题:闪存 + 自适应存储管理 ; 参考:《中国科学技术大学》2012年博士论文
【摘要】:闪存是20世纪80年代由因特尔公司和东芝公司发明的一种新型存储介质,相比传统的磁盘,它在I/O性能,抗震性,功耗,体积等诸多方面都具有明显的优势。所以近年来,闪存有逐渐替代传统磁盘的趋势,开始在各种移动终端,手持设备甚至大型数据中心得到广泛的应用。 另一方面,传统的数据库系统性能出现了瓶颈,这主要体现在作为其存储介质的磁盘发展速度已经远远落后于CPU,内存等其他硬件的发展。由于闪存的出现,一种直观上有效的解决办法即使用闪存作为数据库系统的二级存储介质。但是有研究表明,直接将现有的数据库系统迁移至闪存,其带来的性能加速比远低于闪存相对磁盘的性能加速比。这是因为现有的数据库系统都是针对磁盘进行设计,而闪存与磁盘的物理特性有很大的不同,导致数据库系统中针对磁盘设计的一系列算法在闪存上表现并不令人满意,所以要充分利用闪存的性能,我们必须根据其特性重新设计数据库系统中的各核心算法。 本论文主要针对数据库系统的存储管理,缓冲区管理以及事务恢复等方面进行了深入研究,同时由于闪存应用场景的广泛性,不同的应用场景对于数据库功能的需求也各不相同,所以本论文在如何实现数据库系统功能模块快速裁剪和定制方面也进行了一些试探性的研究。 论文首先介绍了闪存的发展历史,然后针对两种不同的闪存类型:NOR型闪存和NAND型闪存,分析对比了它们在性能,应用场合等各方面的差异。 存储管理是组成数据库系统性能的重要模块,本论文在现有研究的基础上提出了一种适应随机小粒度更新的闪存存储管理模式,该模式通过检测闪存块中数据页的更新模式,动态地分配日志区大小。能够有效地减少闪存的写入和擦除次数,延长整个存储系统的使用寿命。 缓冲区是影响数据库系统性能的重要因素。由于闪存独特的物理特性,命中率一般不能再作为衡量缓冲区算法好坏的标准。在此观察上,论文提出了一种针对日志型闪存存储管理模式的缓冲区算法,它通过检测缓冲页面的冷热,延时写出热页从而有效地减少了闪存的写入和擦除次数,同时该算法中实现了两种日志打包算法,可以明显提高闪存日志区的空间利用率,进一步减少块擦除次数,提高了闪存的使用寿命。 论文还为日志型闪存存储模型提供了一种简单快速的事务支持和恢复算法,该算法通过将提交日志和未提交日志分开存储,可以避免闪存块合并操作导致某些事务无法回滚的问题,同时由于不需要写全局事务状态日志,可以大量减少闪存写次数同时提高闪存空间利用率。 最后在闪存数据库系统的快速定制方面,论文利用面向方面的编程模型,提出了一套基于横切代码位置的抽取算法,并给出了代码从OOP向AOP迁移的技术路线,实验证明该算法可以有效的实现横切代码分离,从而实现数据库系统的定制。 本论文的主要贡献在以下几个方面: (1)提出了一种适应小粒度随机更新的闪存存储管理模型,通过检测闪存块的更新模式,自适应地调整日志区大小,有效地减少了闪存写入和擦除次数。 (2)提出了一种针对日志型闪存存储模型的缓冲区算法,该算法通过对缓冲区的页面进行冷热分类,延时置换热页,有效地减少了闪存写入次数,同时结合两种日志打包算法,提高了闪存日志区的空间利用率,有效地缓和了日志区的碎片问题,提高了闪存的使用寿命。 (3)为(1)中的存储模型提供了一种用于支持快速事务恢复的算法,通过将提交日志和未提交日志进行分离,可以有效解决块合并操作导致的某些事务不可恢复的问题。同时不再需要全局事务状态日志,节省了大量的闪存写操作。 (4)利用面向方面的编程,定义了基于横切代码位置的抽取算法,给出了用于实现数据库系统可裁剪和定制的技术路线,并通过实验证明了该算法的可行性。
[Abstract]:Flash memory is a new type of storage medium invented by Intel Corp and Toshiba Co in 1980s. Compared with traditional disk, it has obvious advantages in I/O performance, seismic resistance, power consumption, volume and so on. So in recent years, flash memory has gradually replaced traditional disk, and began to be in various mobile terminals, handheld devices even. Large data centers are widely used.
On the other hand, the performance of the traditional database system has a bottleneck, which is mainly reflected in the development speed of the disk as its storage medium is far behind the development of other hardware such as CPU, memory and other hardware. Because of the flash memory, a visual and effective solution is to use flash memory as the two level storage medium of the database system. Studies have shown that the performance acceleration of the existing database system directly to flash memory is far lower than the performance acceleration ratio far below the flash relative disk. This is because the existing database systems are designed for the disk, and the physical characteristics of the flash memory and the disk are very different, causing the disk design in the database system. A series of algorithms are not satisfactory in the flash memory, so in order to make full use of the performance of the flash memory, we must redesign the core algorithms in the database system according to their characteristics.
This thesis focuses on the storage management of the database system, the buffer management and the transaction recovery. At the same time, because of the wide application scene of the flash memory, the requirements of the different application scenes are different to the database function. Some tentative studies have also been carried out in the area of customization.
This paper first introduces the development history of flash memory, and then compares two different flash memory types: NOR flash memory and NAND flash memory, and compares their differences in performance, application and other aspects.
Storage management is an important module to make up the performance of the database system. On the basis of the existing research, this paper presents a flash memory management model which adapts to the random particle size update. By detecting the update mode of the data page in the flash memory block, this model dynamically distributs the log area. It can effectively reduce the writing and erasure of the flash memory. The number of times, prolong the life of the whole storage system.
The buffer area is an important factor affecting the performance of the database system. Due to the unique physical characteristics of the flash memory, the hit rate can not be used as a standard to measure the buffer algorithm. In this observation, a buffer algorithm for the log storage management mode is proposed in this paper. By detecting the cold heat of the buffer page, the time delay is written. It can effectively reduce the number of writing and erasure of flash memory. At the same time, two kinds of log packing algorithms are implemented in the algorithm, which can obviously improve the space utilization rate of the flash log area, reduce the number of erasure and improve the service life of the flash memory.
The paper also provides a simple and fast transaction support and recovery algorithm for the log flash memory storage model. This algorithm can avoid the problem that some transactions can not be rolled back by the merge operation of the flash memory block by separating the submission log from the uncommitted log, and it can be greatly reduced because the global transaction status log is not required. The number of flash writes improves the utilization of flash space simultaneously.
Finally, in the fast customization of flash memory database system, the thesis uses aspect oriented programming model to propose a set of extraction algorithm based on cross cut code location, and gives the technical route from OOP to AOP. The experiment proves that the algorithm can effectively separate the crosscutting code, thus realizing the customization of the database system.
The main contributions of this paper are in the following aspects:
(1) a flash memory management model which adapts to the random particle size updates is proposed. By detecting the update mode of the flash memory block, the log area size is adjusted adaptively, and the number of flash memory writes and erasure can be reduced effectively.
(2) a buffer algorithm for log flash memory storage model is proposed. This algorithm can effectively reduce the number of flash memory by using cold and heat classification of the page of the buffer zone, effectively reducing the number of flash writing, and combining two log packing algorithms to improve the spatial utilization of the flash log area and effectively mitigate the fragmentation of the log area. The problem is to improve the life of the flash memory.
(3) the storage model in (1) provides an algorithm to support fast transaction recovery. By separating the submission log from the uncommitted log, it can effectively solve the problem of the unrecoverable transaction caused by the block merge operation. At the same time, the global transaction log is no longer needed, and a large number of flash writing operations are saved.
(4) using aspect oriented programming, a decimation algorithm based on the crosscutting code location is defined, and a technical route for the database system to be tailored and customized is given, and the feasibility of the algorithm is proved by experiments.
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP333
【相似文献】
相关期刊论文 前10条
1 alfa;;威刚ADATA 8GB My Flash闪存盘[J];电脑自做;2007年03期
2 创新;第四代JetFlas闪存盘[J];军民两用技术与产品;2003年12期
3 陈宏林;;装了锁的闪存盘——Kingston加密闪存盘[J];微电脑世界;2006年08期
4 徐阳;;泡在水里也能用——ATP ToughDrive mini闪存盘[J];微电脑世界;2007年07期
5 王炳晨;;随时随地 贴心防范 金士顿“杀毒”闪存盘[J];微电脑世界;2008年08期
6 ;小身材大容量 金士顿Data Traveler Mini Slim闪存盘[J];电脑迷;2008年21期
7 香香;闪盘盘符不见了去哪里找[J];电脑应用文萃;2004年03期
8 ;还能有多快 雷克沙JumpDrive闪盘[J];电脑数码采购周刊;2005年S1期
9 ;PQI Traveling Disk U250闪存盘[J];电脑迷;2006年01期
10 ;MP4数码周遍[J];电脑采购周刊;2006年28期
相关会议论文 前10条
1 焦磊;张延园;;基于日志翻译层的冗余闪存阵列研究[A];第15届全国信息存储技术学术会议论文集[C];2008年
2 马玉书;李国和;龚平;江伟峰;;用面向对象环境开发知识库/数据库系统[A];第十一届全国数据库学术会议论文集[C];1993年
3 吕新宇;彭成宝;张霞;;移动计算环境下的数据库系统OpenBASE Mini[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
4 张丽;;从IMAGE到ORACLE数据库系统转换工具的设计与实现[A];第十届全国数据库学术会议论文集[C];1992年
5 李敏;费丽娟;胡金柱;;数据库系统中大事务处理问题的研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 赵加奎;陈立军;杨冬青;唐世渭;;SQLDBA——基于数据流系统Argus的数据库系统性能实时监控工具[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 张霞;郑怀远;;面向对象和语义关联数据库系统的用户友好接口[A];第九届全国数据库学术会议论文集(上)[C];1990年
8 赵莉莉;王引斌;;浅谈数据库系统的发展[A];山西省科技情报学会2004年学术年会论文集[C];2005年
9 张慧斌;袁晓洁;王鑫;汪陈应;刘芳;;XBackend:一种Native XML数据库系统的后端实现策略[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 高国弘;郭立新;范彦芳;李香芳;;多类型数据库系统环境下气象信息分布式共享技术研究[A];2011年中国气象学会气象通信与信息技术委员会暨国家气象信息中心科技年会论文摘要[C];2011年
相关重要报纸文章 前10条
1 实习生 郑宇 薛松;U盘大跳水[N];深圳商报;2006年
2 ;盛夏的果实[N];计算机世界;2004年
3 李南玲;“优盘”掀起闪存盘降价风暴[N];中国税务报;2006年
4 李南玲;闪存盘行业面临新一轮洗牌[N];大众科技报;2006年
5 计算机世界实验室 周童;不简单的闪存盘[N];计算机世界;2007年
6 林雨;闪存盘多元化应用崭露头角[N];民营经济报;2007年
7 王志军;用MPTool打造个性化闪存盘[N];中国电脑教育报;2003年
8 ;透析风雨交错的闪存盘市场[N];中国高新技术产业导报;2004年
9 黎音;“密盘”风靡校园 朗科三大必杀技夺芳心[N];经理日报;2009年
10 ;蓝科“遥控精灵”闪存盘[N];电脑报;2002年
相关博士学位论文 前10条
1 卢科;闪存数据库系统存储管理及可裁剪性研究[D];中国科学技术大学;2012年
2 陈建英;基于数字有机体数据库系统的搜索定位研究[D];电子科技大学;2011年
3 余辉龙;CMOS一体化相机关键技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2010年
4 史纪安;江河源区生态环境质量评价及数据库研建[D];西北农林科技大学;2006年
5 乌尼尔夫;中国马业综合数据库的建立及马基因组序列预测[D];内蒙古农业大学;2009年
6 相克俊;混合推理高速切削数据库系统的研究与开发[D];山东大学;2007年
7 赵韩涛;基于GIS-T的高速公路紧急救援系统构建及相关模型研究[D];吉林大学;2006年
8 马利民;新一代产品几何量技术规范(GPS)理论框架体系及关键技术研究[D];华中科技大学;2006年
9 于洋;肝癌中医临床信息数据库系统的构建及应用[D];第二军医大学;2009年
10 毕雪亮;基于知识发现的钻井工程优化理论及应用[D];大庆石油学院;2007年
相关硕士学位论文 前10条
1 董继宣;通用闪存控制器的设计[D];哈尔滨工业大学;2009年
2 赵辉;混合NAND型闪存实验平台的研究[D];中国科学技术大学;2011年
3 吕琳;闪存盘结构分析及其扩展功能应用研究[D];大连海事大学;2004年
4 罗朝劲;D-SQL分布式数据库系统的启动与恢复[D];电子科技大学;2002年
5 刘美香;基于COM/DCOM的多数据库系统[D];昆明理工大学;2002年
6 周伟;螺旋桨负载仿真装置[D];哈尔滨工程大学;2006年
7 马宏剑;湛江地区全风化花岗岩路用特性与地理信息系统应用研究[D];东南大学;2006年
8 宫爱红;汽车模具高速切削工艺参数数据库系统的设计[D];华中科技大学;2006年
9 劳越明;数字化服装样板管理系统的研发[D];苏州大学;2007年
10 冯雪莲;基于UML的图书馆网络管理系统的设计与实现[D];天津大学;2007年
,本文编号:2074832
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2074832.html