当前位置:主页 > 科技论文 > 自动化论文 >

分布式存储系统HBase性能调优方法的研究与实现

发布时间:2021-01-05 20:22
  随着大数据时代的到来,数据库中数据量急剧增长,同时数据访问量也逐渐增大,导致系统功能的响应时间越来越慢。在实际系统中,一些功能的响应时间随着数据规模的增大而变大,数据插入、检索的响应时间也越来越大。因此如何通过优化HBase的性能降低系统功能的响应时间成为该系统的一个重要问题,同时也是工业界以及学术界亟待解决的一个重要问题。针对上述提出的数据库性能优化问题,本文通过调研并总结与非关系型数据库性能优化相关的国内外研究现状,选择当前主流的分布式存储系统HBase作为研究对象,实现了一种HBase性能调优方法。在大量实验样本数据的基础上,采用随机森林算法分析HBase性能与参数之间的关系,从而构建HBase吞吐量和延迟预测模型。基于预测模型,提出改进的遗传算法对HBase性能进行优化,最终实现HBase性能调优方法。本文的研究内容主要包含以下几个方面:(1)特征筛选与训练样本生成。根据HBase官方文档中的描述,对HBase特征进行两次筛选,得到影响HBase性能的参数集合。接着进行训练样本的生成,采用正交试验设计方法来选择具有代表性的特征样本进行实验,获取吞吐量和延迟的实验值。(2)预测模... 

【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校

【文章页数】:80 页

【学位级别】:硕士

【部分图文】:

分布式存储系统HBase性能调优方法的研究与实现


UH工作负载实验运行结果

【参考文献】:
期刊论文
[1]随机森林理论浅析[J]. 董师师,黄哲学.  集成技术. 2013(01)

博士论文
[1]分布式文件系统性能建模及应用研究[D]. 赵铁柱.华南理工大学 2011

硕士论文
[1]分布式系统性能测试与分析方法研究[D]. 刘玮.大连理工大学 2011



本文编号:2959244

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2959244.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户399b9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com