多存储层次能效散列连接算法
发布时间:2020-04-28 14:20
【摘要】:连接是数据库系统查询处理中的一个核心操作,高能效连接算法是能效DBMS中的一个重要研究议题。固态盘和硬盘比较具有随机读写性能快的优势,数据库系统中合理利用这一优势提升连接算法的能效成为可能。本文针对散列连接分区阶段随机写严重的情况,分别在二存储层次(内存+固态盘或硬盘)和多存储层次(内存+固态盘和硬盘)两种情形下,提出了不同的解决方案消除随机I/O对算法性能和能效的不利影响。主要完成了以下几方面工作: 1.在数据库存储设备为固态盘的环境中提出了单文件的GRACE散列连接算法(SFHJ), SFHJ分区阶段同一张表的所有分区存储在一个临时文件。该算法能利用固态盘随机读延迟低和顺序写带宽高的优势,提升连接算法性能。 2.在数据库存储设备为硬盘的环境中,提出通过缓存优化来减少随机I/O的缓存优化混合散列连接算法(OHHJ),即通过合理优化分区阶段桶缓存的大小来尽量减少分区过程中产生的随机I/O。 3.在由HDD和SSD混合的数据库多存储层次系统中,结合SFHJ提出了基于硬盘和固态盘混合存储系统下的组合盘GRACE散列连接算法(CGHJ)。 CGHJ对GRACE散列连接算法分区阶段作如下改进:将固态盘作为内存和硬盘之间的缓存,分区阶段桶缓存满后先写回固态盘的临时文件;临时文件缓存满后,利用迁移缓存将固态盘中的数据转移到硬盘的分区文件。同时在多存储层次系统下对HHJ进行改进,提出了CHHJ。 实验结果表明OHHJ能效要一直好于HHJ,而SFHJ和CGHJ在特定的条件下能效也能得到较大的提升。
【学位授予单位】:浙江工业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333;TP311.13
本文编号:2643561
【学位授予单位】:浙江工业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP333;TP311.13
【参考文献】
相关期刊论文 前4条
1 杨濮源;金培权;岳丽华;;一种时间敏感的SSD和HDD高效混合存储模型[J];计算机学报;2012年11期
2 汤显;孟小峰;梁智超;卢泽萍;;基于代价的闪存数据库缓冲区置换算法[J];软件学报;2011年12期
3 刘沾沾;岳丽华;金培权;向小岩;;一种针对闪存的高效缓冲区置换算法[J];小型微型计算机系统;2010年08期
4 刘圣卓;姜进磊;杨广文;;一种面向SSD-HDD混合存储的热区跟踪替换算法[J];小型微型计算机系统;2012年10期
,本文编号:2643561
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2643561.html