当前位置:主页 > 科技论文 > 计算机论文 >

融合多核和MapReduce的连接聚集查询优化

发布时间:2018-08-23 20:55
【摘要】:连接聚集查询是大规模数据分析的核心操作算子之一,多核处理器为大规模数据的连接聚集查询操作提供了优化空间但同时也存在很大挑战.主要针对多核处理器集群环境,研究MapReduce框架下大规模数据连接聚集查询的优化算法.首先,基于传统MapReduce框架设计并实现了Map端的单线程连接聚集查询算法,基于实验分析指出MapReduce和多核处理器融合提升性能的必要性;其次,针对处理器的多核架构,设计并实现了Map端的多线程连接聚集查询算法,找出了MapReduce和多核处理器融合的性能瓶颈;进而,提出了Map端对输入分片无竞争读取的多线程连接聚集查询算法,该算法让MapReduce充分利用了多核处理器的性能优势.实验结果表明,提出的算法在大规模数据的连接聚集查询处理上充分发挥了硬件优势,具有较好的时间性能和可扩展性.
[Abstract]:Join aggregation query is one of the core operators in large-scale data analysis. Multi-core processors provide optimization space for large scale data join aggregation query operation, but there are also great challenges at the same time. Aiming at multi-core processor cluster environment, the optimization algorithm of large scale data join aggregation query under MapReduce framework is studied. Firstly, a single thread join aggregation query algorithm based on traditional MapReduce framework is designed and implemented. Based on experimental analysis, the necessity of MapReduce and multi-core processor fusion to improve performance is pointed out. This paper designs and implements a multi-thread join aggregation query algorithm in Map, finds out the performance bottleneck of MapReduce and multi-core processor fusion, and then proposes a multi-thread join aggregation query algorithm based on Map. This algorithm allows MapReduce to take full advantage of the performance advantages of multi-core processors. The experimental results show that the proposed algorithm can give full play to the hardware advantages and has good time performance and extensibility in large-scale data join aggregation query processing.
【作者单位】: 桂林电子科技大学广西可信软件重点实验室;桂林电子科技大学广西自动检测技术与仪器重点实验室;
【基金】:国家自然科学基金项目(61462017;61363005) 广西自然科学基金项目(2014GXNSFAA118353;2014GXNSFAA118390;2014GXNSFDA118036) 广西高校科研资助项目(2013YB083) 广西自动检测技术与仪器重点实验室基金项目(YQ15110;YQ14109) 桂林电子科技大学研究生创新资助项目(GDYCSZ201465) 广西高等学校高水平创新团队及卓越学者计划
【分类号】:TP332

【参考文献】

相关期刊论文 前1条

1 陈勇旭;陈梦杰;刘雪冰;宋杰;;基于MapReduce的连接聚集查询算法研究[J];计算机研究与发展;2013年S1期

【相似文献】

相关期刊论文 前10条

1 张浩;兰峰;;多核处理器基本原理及其在汽车领域中应用的展望[J];汽车科技;2007年03期

2 何军;王飙;;多核处理器的结构设计研究[J];计算机工程;2007年16期

3 肖红;;基于多核处理器系统开发中的几个问题[J];广东广播电视大学学报;2007年04期

4 张健浪;;三大于二,多核CPU之田忌赛马[J];新电脑;2008年06期

5 都思丹;;前言:嵌入式多核处理器系统及视频信号处理技术研究进展[J];南京大学学报(自然科学版);2009年01期

6 黄国睿;张平;魏广博;;多核处理器的关键技术及其发展趋势[J];计算机工程与设计;2009年10期

7 张戈;胡伟武;黄琨;曾洪博;王君;;片上多核处理器的结构级功耗建模与优化技术研究[J];自然科学进展;2009年12期

8 万志涛;章恒;张若渊;;基于多核处理器的深度包检测的实现和性能评估[J];电信科学;2009年S2期

9 李晋惠;寇立涛;乔永兴;;用软件来提高多核处理器性能的方法分析[J];工业仪表与自动化装置;2010年01期

10 严婕;;针对多媒体应用的多核处理器核间通信优化[J];计算机应用与软件;2010年08期

相关会议论文 前10条

1 郭建军;戴葵;王志英;;一种多核处理器存储层次性能评估模型[A];第八届全国信息隐藏与多媒体安全学术大会湖南省计算机学会第十一届学术年会论文集[C];2009年

2 彭林;张小强;刘德峰;谢伦国;田祖伟;;一种挖掘多核处理器存储级并行的算法[A];第15届全国信息存储技术学术会议论文集[C];2008年

3 刘杰;马彦;叶维;高剑刚;;多核处理器存储体系分析[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

4 潘送军;胡瑜;李晓维;;多核处理器瞬态故障敏感性分析[A];第五届中国测试学术会议论文集[C];2008年

5 方娟;张红波;;多核处理器预取策略的研究[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年

6 何军;王飙;;通用多核处理器发展现状和趋势研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

7 桂亚东;;高效能计算机技术展望[A];庆祝中国力学学会成立50周年暨中国力学学会学术大会’2007论文摘要集(下)[C];2007年

8 万志涛;;基于多核处理器的面向时延敏感服务的云基础架构[A];中国通信学会信息通信网络技术委员会2011年年会论文集(上册)[C];2011年

9 陈远知;;多核处理器的里程碑——TILE64[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年

10 张炜;冯权友;曾超;窦文华;;一种基于光互连技术的存储墙问题解决方案[A];中国电子学会第十六届信息论学术年会论文集[C];2009年

相关重要报纸文章 前10条

1 记者 曹继军 颜维琦;我国多核处理器研究实现新突破[N];光明日报;2012年

2 李梅 编译;多核处理器新年井喷[N];计算机世界;2007年

3 英特尔产品与平台市场部门数字家庭市场经理 庄淳杰;多核将大行其道[N];计算机世界;2007年

4 本报记者 陈斌;多核处理器的未来路径[N];计算机世界;2008年

5 ;多核:技术无悬念应用待拓展[N];计算机世界;2008年

6 Hillstone首席软件架构师 王钟;多核是更好的选择[N];网络世界;2009年

7 宋家雨;服务器销量会减半吗?[N];网络世界;2007年

8 蒋楠;美国 青少年变身“多核处理器”[N];中国计算机报;2006年

9 清华大学计算机系 教授 郑纬民;“多核”成为关键词[N];计算机世界;2007年

10 中航工业计算所 牛文生;计算机技术的一些新进展[N];中国航空报;2011年

相关博士学位论文 前10条

1 王淼;面向多核处理器的并行编译及优化关键技术研究[D];国防科学技术大学;2010年

2 魏海涛;面向多核处理器的数据流程序编译关键技术研究[D];华中科技大学;2010年

3 吕海;多核处理器芯片计算平台中并行程序性能优化的研究[D];北京工业大学;2012年

4 李建华;片上多核处理器缓存子系统优化的研究[D];中国科学技术大学;2013年

5 杜建军;共享高速缓存多核处理器的关键技术研究[D];重庆大学;2011年

6 陈锐忠;非对称多核处理器的若干调度问题研究[D];华南理工大学;2013年

7 邓林;单芯片多核处理器存储优化技术研究[D];国防科学技术大学;2011年

8 吕正;多核处理器存储系统的验证方法研究[D];西北大学;2013年

9 张宇昂;三维多核处理器存储关键技术研究[D];南京大学;2015年

10 赖明澈;同步数据触发多核处理器体系结构关键技术研究[D];国防科学技术大学;2008年



本文编号:2199890

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2199890.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cadb0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com