基于Hadoop的海量小文件合并的研究与设计

发布时间：2017-11-06 18:11

本文关键词：基于Hadoop的海量小文件合并的研究与设计

【摘要】：基于Hadoop海量小文件合并的策略研究,一方面为了减轻Name Node的元数据量,利用Eclipse开发工具实现了Har、HBase、Sequence File三种主流合并方案对海量小文件的合并;另一方面分析这三种主流合并方案在不同场景下性能以及应用方面的优劣,进而为海量小文件在Hadoop上的存储提供一些有价值的参考.
【作者单位】：广东技术师范学院电子与信息学院;
【基金】：广东省公益研究与能力建设专项资金(2014A010103032) 广东省科技型中小企业技术创新专项资金项目(2016A010120010;2014A010101109;2014A010101092)资助
【分类号】：TP333;TP311.13
【正文快照】： 1引言Hadoop分布式数据存储和处理框架凭借其高效、可靠、高容错等优点,渐渐成为了炙手可热的大数据存储和处理工具.Hadoop分布式文件系统(HDFS)是Hadoop的核心部分,它所具有的两类节点以管理者-工作者的模式运行,即单一Name Node(管理者)和若干个Data Node(工作者).Name Node

【相似文献】

中国期刊全文数据库前3条

1 李宁;;浅析使用电子文件的新问题及对策[J];石油化工应用;2006年06期

2 袁敏;;电子文件在归档工作中几点问题的思考[J];办公自动化;2007年18期

3 ;[J];;年期

中国硕士学位论文全文数据库前1条

1 左大鹏;Hadoop小文件存储管理的研究与实现[D];北京交通大学;2015年

，

本文编号：1148793

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1148793.html

上一篇：戴尔公司与惠普公司在华营销策略比较研究
下一篇：多元立体式创新人才生态培养体系的构建与实施——以成都大学信息科学与工程学院为例

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|