当前位置:主页 > 科技论文 > 计算机论文 >

多核处理器中基于MapReduce的哈希划分优化

发布时间:2018-11-05 20:34
【摘要】:针对传统的并行哈希划分算法不能高效地利用多核处理器的并行资源,且不能较好处理有倾斜的输入数据的问题,提出了一种在多核处理器中基于MapReduce的哈希划分算法,并且提出了存储结构优化、多步划分优化、数据倾斜优化3种优化策略。该算法将输入数据分成若干块后提交给各个线程并行处理,并选择合适的策略避免写冲突,使其能够高效地利用多核处理器的并行资源。文中提出的哈希表能够提高cache效率,从而提升算法的整体性能。引入MapReduce模型可使多步哈希划分在Map过程和Reduce过程中分别进行;数据倾斜优化策略能使算法适应有倾斜的输入数据,且具有较好的效果。实验结果表明:在多核处理器中,文中提出的算法能够适应各种分布的输入数据,并且使哈希划分的整体性能得到提升。
[Abstract]:Aiming at the problem that the traditional parallel hash partition algorithm can not efficiently utilize the parallel resources of the multi-core processor and can not handle the skewed input data, a hash partition algorithm based on MapReduce in the multi-core processor is proposed. Three optimization strategies, storage structure optimization, multi-step partition optimization and data skew optimization, are proposed. The algorithm divides the input data into several blocks and submits them to each thread for parallel processing, and selects appropriate strategies to avoid write conflicts, so that it can efficiently utilize the parallel resources of multi-core processors. The hash table proposed in this paper can improve the efficiency of cache and improve the overall performance of the algorithm. By introducing MapReduce model, the multi-step hash partition can be carried out in the Map process and the Reduce process, and the data skew optimization strategy can adapt the algorithm to the skewed input data, and it has a good effect. Experimental results show that the proposed algorithm can adapt to all kinds of distributed input data and improve the overall performance of hash partitioning in multi-core processors.
【作者单位】: 西安电子科技大学计算机学院;
【基金】:国家科技支撑计划资助项目(2012BAH01B05) 陕西省科技统筹创新工程计划资助项目(2012KTZD-02-05-2)
【分类号】:TP332

【参考文献】

相关期刊论文 前1条

1 邓亚丹;景宁;熊伟;;基于共享Cache多核处理器的Hash连接优化[J];软件学报;2010年06期

【共引文献】

相关期刊论文 前3条

1 陈伟;杜凌霞;陈红;;多核架构下的数据处理算法优化策略综述[J];计算机科学与探索;2011年12期

2 黎建辉;刘勇;王卫华;周园春;薛兴亚;;MapReduce计算模型下的化合物LC-MS鉴定[J];计算机科学与探索;2011年12期

3 颜坚;毕硕本;汪大;郭忆;;多核架构下计算凸壳的并行算法[J];计算机科学;2013年02期

相关会议论文 前1条

1 孙莉;郝大腾;王梅;;列存储数据仓库中Hash连接改进算法研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

【相似文献】

相关期刊论文 前10条

1 冯磊;;多核处理器的数量裸奔[J];信息系统工程;2006年11期

2 张浩;兰峰;;多核处理器基本原理及其在汽车领域中应用的展望[J];汽车科技;2007年03期

3 何军;王飙;;多核处理器的结构设计研究[J];计算机工程;2007年16期

4 肖红;;基于多核处理器系统开发中的几个问题[J];广东广播电视大学学报;2007年04期

5 张健浪;;三大于二,多核CPU之田忌赛马[J];新电脑;2008年06期

6 都思丹;;前言:嵌入式多核处理器系统及视频信号处理技术研究进展[J];南京大学学报(自然科学版);2009年01期

7 黄国睿;张平;魏广博;;多核处理器的关键技术及其发展趋势[J];计算机工程与设计;2009年10期

8 张戈;胡伟武;黄琨;曾洪博;王君;;片上多核处理器的结构级功耗建模与优化技术研究[J];自然科学进展;2009年12期

9 万志涛;章恒;张若渊;;基于多核处理器的深度包检测的实现和性能评估[J];电信科学;2009年S2期

10 李晋惠;寇立涛;乔永兴;;用软件来提高多核处理器性能的方法分析[J];工业仪表与自动化装置;2010年01期

相关会议论文 前10条

1 郭建军;戴葵;王志英;;一种多核处理器存储层次性能评估模型[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年

2 彭林;张小强;刘德峰;谢伦国;田祖伟;;一种挖掘多核处理器存储级并行的算法[A];第15届全国信息存储技术学术会议论文集[C];2008年

3 刘杰;马彦;叶维;高剑刚;;多核处理器存储体系分析[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

4 潘送军;胡瑜;李晓维;;多核处理器瞬态故障敏感性分析[A];第五届中国测试学术会议论文集[C];2008年

5 万志涛;章恒;张若渊;;基于多核处理器的深度包检测的实现和性能评估[A];中国通信学会信息通信网络技术委员会2009年年会论文集(上册)[C];2009年

6 方娟;张红波;;多核处理器预取策略的研究[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年

7 何军;王飙;;通用多核处理器发展现状和趋势研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

8 桂亚东;;高效能计算机技术展望[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年

9 万志涛;;基于多核处理器的面向时延敏感服务的云基础架构[A];中国通信学会信息通信网络技术委员会2011年年会论文集(上册)[C];2011年

10 陈远知;;多核处理器的里程碑——TILE64[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年

相关重要报纸文章 前10条

1 记者 曹继军 颜维琦;我国多核处理器研究实现新突破[N];光明日报;2012年

2 庆广;多核处理器助力无线多媒体业务拓展[N];中国电子报;2009年

3 北京大学计算语言所副所长 詹卫东;多核服务器:计算优势更上层楼[N];计算机世界;2005年

4 北京大学计算语言所副所长 詹卫东;双/多核服务器 计算优势更上层楼[N];网络世界;2005年

5 江南计算技术研究所 何正未;软件滞后制约多核应用[N];计算机世界;2006年

6 李梅 编译;多核处理器新年井喷[N];计算机世界;2007年

7 英特尔产品与平台市场部门数字家庭市场经理 庄淳杰;多核将大行其道[N];计算机世界;2007年

8 本报记者 陈斌;多核处理器的未来路径[N];计算机世界;2008年

9 王悦承;Oracle改变多核定价模式[N];中国计算机报;2006年

10 ;多核:技术无悬念应用待拓展[N];计算机世界;2008年

相关博士学位论文 前10条

1 王淼;面向多核处理器的并行编译及优化关键技术研究[D];国防科学技术大学;2010年

2 魏海涛;面向多核处理器的数据流程序编译关键技术研究[D];华中科技大学;2010年

3 吕海;多核处理器芯片计算平台中并行程序性能优化的研究[D];北京工业大学;2012年

4 李建华;片上多核处理器缓存子系统优化的研究[D];中国科学技术大学;2013年

5 杜建军;共享高速缓存多核处理器的关键技术研究[D];重庆大学;2011年

6 陈锐忠;非对称多核处理器的若干调度问题研究[D];华南理工大学;2013年

7 邓林;单芯片多核处理器存储优化技术研究[D];国防科学技术大学;2011年

8 吕正;多核处理器存储系统的验证方法研究[D];西北大学;2013年

9 赖明澈;同步数据触发多核处理器体系结构关键技术研究[D];国防科学技术大学;2008年

10 蒋建春;异构多核嵌入式软件关键问题研究[D];重庆大学;2011年

相关硕士学位论文 前10条

1 谢子光;多核处理器核间通信技术研究[D];电子科技大学;2009年

2 王兴启;多核处理器的有锁编程与非阻塞算法研究[D];中原工学院;2011年

3 尤凯迪;高性能低功耗多核处理器研究[D];复旦大学;2011年

4 杨国芳;多核处理器核间通信技术研究[D];哈尔滨工程大学;2011年

5 姚宗宝;多核处理器的加速比研究与热设计[D];苏州大学;2012年

6 韩毅宏;多核处理器网络应用研究[D];西安电子科技大学;2010年

7 盛肖炜;多核处理器内部核间通信研究[D];沈阳理工大学;2013年

8 徐军;多核处理器功耗和热量模型研究及实现[D];上海交通大学;2009年

9 奚海波;并行编程技术在多核处理器上的研究与应用[D];东北师范大学;2010年

10 王雪梅;嵌入式多核处理器的仿真器设计[D];国防科学技术大学;2010年



本文编号:2313376

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2313376.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f271d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com