非CDN环境小文件存取优化研究
本文选题:海量小文件 + 分布式文件系统 ; 参考:《昆明理工大学》2017年硕士论文
【摘要】:现阶段,随着企业业务增长,数据存储量高速增长,企业对于数据存储的可扩展性不断提出了的要求。在新存储需求下,传统的数据存储方式已经无法满足新一代的技术要求,扩展性强、价格低廉的分布式存储系统则逐渐成为众多企业的选择。当前市面上主要的分布式存储产品,要么为大型对象存储设计,要么是基于互联网的产品,并不适用于没有CDN(Content Delivery Network)的企业内部环境中。本文在weedfs的基础上,以分布式存储技术为核心,基于企业对小文件存储需求的现状,对无CDN环境下的小文件分布存储应用进行了初步探索,具体开展了以下研究:第一,回顾存储系统的发展历程,分析当前各个分布存储技术的特点。第二,为weedfs添加了一个分布式缓存系统,并针对传统缓存算法的缺点,改进了缓存算法对各种场景的适应能力。第三,结合传统的缓存算法和机器学习技术,进一步提高整个缓存系统的性能。本文通过引入一个缓存系统对weedfs进行了改进,同时将机器学习和传统的缓存技术相结合,为企业内部处理海量小文件提供了一个新的选择。本研究对其他行业存储系统的选择和缓存算法的改进也具有一定的借鉴意义。
[Abstract]:At present, with the growth of enterprise business and the rapid growth of data storage capacity, the scalability of data storage is constantly required by enterprises. Under the new storage demand, the traditional data storage method can not meet the new generation of technical requirements. The distributed storage system with strong expansibility and low price has gradually become the choice of many enterprises. At present, the main distributed storage products in the market are either designed for large-scale object storage or Internet-based products, and are not suitable for the internal environment of enterprises without CDN (content delivery Network). On the basis of weedfs, based on the distributed storage technology and the current situation of enterprises' demand for small file storage, this paper makes a preliminary exploration on the application of distributed small file storage in the non-CDN-based environment. The following researches are carried out: first, This paper reviews the development of storage system and analyzes the characteristics of each distributed storage technology. Secondly, we add a distributed cache system to weedfs, and improve the adaptability of the cache algorithm to various scenarios in view of the shortcomings of the traditional cache algorithm. Thirdly, the performance of the whole cache system is further improved by combining the traditional cache algorithm and machine learning technology. This paper improves weedfs by introducing a cache system, and combines machine learning with traditional cache technology, which provides a new choice for internal processing of large amount of small files. This research also has certain reference significance to other industries storage system choice and the cache algorithm improvement.
【学位授予单位】:昆明理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP333
【相似文献】
相关期刊论文 前10条
1 王雪涛;刘伟杰;;分布式文件系统[J];科技信息(学术研究);2006年11期
2 陈剑;龚发根;;一种优化分布式文件系统的文件合并策略[J];计算机应用;2011年S2期
3 郎为民;杨德鹏;;云计算中的分布式文件系统[J];电信快报;2012年02期
4 陈文捷;蔡立志;楼志斌;王洁萍;李海波;;应用级分布式文件系统接口标准化探索[J];信息技术与标准化;2012年10期
5 应朝晖,高洪奎,,黄若衡;分布式文件系统[J];计算机工程与科学;1995年03期
6 卢军;卢显良;韩宏;许腾;;基于移动Agent的新型分布式文件系统研究[J];计算机科学;2002年10期
7 寒江约叟;N个资源一次看——分布式文件系统妙用[J];电脑应用文萃;2004年07期
8 黄华,张建刚,许鲁;蓝鲸分布式文件系统的分布式分层资源管理模型[J];计算机研究与发展;2005年06期
9 黄华;张建刚;许鲁;;蓝鲸分布式文件系统的客户端元数据缓存模型[J];计算机科学;2005年09期
10 黄华;张敬亮;张建刚;许鲁;;蓝鲸分布式文件系统的物理资源管理模型[J];计算机工程;2006年06期
相关会议论文 前4条
1 华清;黄林鹏;;基于分片、松耦合的分布式文件系统的设计与实现[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
2 洪穗;;微软WINDOWS Server 2003 R2分布式文件系统解决方案分析[A];中国新闻技术工作者联合会2008年学术年会论文集(上)[C];2008年
3 罗志明;张大华;王电钢;常健;;电力分布式云存储关键技术研究[A];2012年电力通信管理暨智能电网通信技术论坛论文集[C];2013年
4 徐文斌;;大数据时代的交管综合应用云平台[A];第八届中国智能交通年会论文集[C];2013年
相关重要报纸文章 前10条
1 国家高性能计算机工程技术研究中心 黄华 杨德志 张建刚;分布式文件系统的历史与现状[N];中国计算机报;2005年
2 国家高性能计算机工程技术研究中心 黄华 杨德志 张建刚;分布式文件系统趋向成熟[N];中国计算机报;2005年
3 国防科学技术大学计算机学院软件所 董勇 周恩强;构建分布式文件系统[N];中国计算机报;2005年
4 ;分布式文件系统一瞥[N];网络世界;2002年
5 王春海 刘立;分布式文件系统在网络中的应用[N];电脑报;2004年
6 ;Hadoop:为构建海量数据架构而生[N];人民邮电;2012年
7 本报记者 于翔;“大数据”的大承诺[N];网络世界;2010年
8 IBM大数据专家 James Kobielus 范范 编译;YARN动摇了MapReduce对Hadoop的掌控[N];网络世界;2013年
9 张力平;云计算和物联网的美妙融合[N];学习时报;2014年
10 《网络世界》记者 于翔;大数据治理多管齐下[N];网络世界;2012年
相关博士学位论文 前4条
1 赵铁柱;分布式文件系统性能建模及应用研究[D];华南理工大学;2011年
2 史小冬;分布式文件系统高可用问题研究[D];中国科学院研究生院(计算技术研究所);2002年
3 黄华;蓝鲸分布式文件系统的资源管理[D];中国科学院研究生院(计算技术研究所);2005年
4 杨德志;分布式文件系统可扩展元数据服务关键问题研究[D];中国科学院研究生院(计算技术研究所);2008年
相关硕士学位论文 前10条
1 冷志强;基于分布式文件系统GlusterFS的横向扩展云存储的研究与实现[D];复旦大学;2014年
2 黎斌;基于HDFS的分布式文件系统存储研究与优化[D];电子科技大学;2015年
3 何雄;大小文件跨网络集群快速迁移协议[D];电子科技大学;2015年
4 焦晨宇;可伸缩分布式文件系统及其应用[D];北京理工大学;2015年
5 谯林飞;云计算环境中分布式文件系统数据一致性问题研究[D];电子科技大学;2014年
6 秦小寒;优化性能的分布式存储子系统的设计与实现[D];电子科技大学;2014年
7 牛升;分布式文件系统的负载均衡策略研究[D];电子科技大学;2014年
8 郭建国;基于分布式文件系统FastDFS的图片服务器件设计与应用[D];中国科学院大学(工程管理与信息技术学院);2015年
9 白铖;一种分布式文件系统的设计与实现[D];电子科技大学;2015年
10 吴霖;分布式微信公众平台爬虫系统的研究与应用[D];南华大学;2015年
本文编号:2109686
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2109686.html