ALFHJ:一种面向众核协处理器的自适应无锁哈希连接算法
本文选题:哈希连接 切入点:无锁 出处:《计算机学报》2017年10期
【摘要】:众核协处理器因其良好的并行计算能力和能源效率,正成为当前高性能计算普遍采用的加速设备.无划分哈希连接算法是多核平台上一种简单高效的连接算法,但随着众核上并发线程数的增加,其共享哈希表的锁同步问题正成为算法并行化的瓶颈.为解决上述问题,该文提出一种面向众核协处理器的自适应无锁哈希连接算法ALFHJ.该算法通过评估数据集的潜在冲突度动态调整算法参数及处理流程,支持基于CAS(比较与交换)原子操作的无锁共享哈希表构建,并利用SIMD指令进行哈希表探测.同时,该文进行了热点代码分析,讨论了一致性问题、ABA问题以及收敛性问题.在Xeon Phi上的实验结果表明,相比最新的基于锁同步的NPO(优化的无分区哈希连接)算法,ALFHJ算法有以下两点优势:(1)在提高哈希表空间利用率的同时,更能保持性能的相对稳定;(2)并行执行时间对于均匀数据集减少约10%,对于倾斜数据集减少约30%~50%.
[Abstract]:Due to its good parallel computing capability and energy efficiency, multi-core coprocessor is becoming a widely used accelerator in high performance computing. Non-partition hash join algorithm is a simple and efficient join algorithm on multi-core platform. However, with the increase of the number of concurrent threads on the multikernel, the lock synchronization problem of the shared hash table is becoming the bottleneck of the parallelization of the algorithm. In this paper, an adaptive unlocked hashing algorithm ALFHJ for multi-kernel coprocessor is proposed. The algorithm dynamically adjusts the parameters and processing flow of the algorithm by evaluating the potential conflict degree of the data set. It supports the construction of unlocked shared hash table based on CAS atomic operation, and detects the hash table using SIMD instruction. At the same time, the hot spot code analysis is carried out in this paper. The consistency problem and convergence problem are discussed. The experimental results on Xeon Phi show that, Compared with the new Lock Synchron-based NPO (optimized Partition Free Hash join) algorithm, ALFHJ has the following two advantages: 1) improving the utilization rate of hash table space, A relatively stable parallel execution time is reduced by about 10 for uniform data sets and 30, 50 for tilted datasets.
【作者单位】: 中国人民大学数据工程与知识工程国家教育部重点实验室;中国人民大学信息学院;西南林业大学计算机与信息学院;
【基金】:国家自然科学基金(61532021,61772537,61772536,61702522) 国家重点研发计划(2016YFB1000702) 国家“九七三”重点基础研究发展计划项目基金(2014CB340402) 云南省应用基础研究基金(2011FB070)资助~~
【分类号】:TP301.6;TP332
【相似文献】
相关期刊论文 前10条
1 张健浪;;协处理器平台打造战略核心[J];个人电脑;2006年10期
2 张雨浓;马伟木;李克讷;易称福;;简述协处理器发展历程及前景展望[J];中国科技信息;2008年13期
3 赵成彦;;80387协处理器的选购与安装[J];电脑爱好者;1995年07期
4 朱樟明,周端,杨银堂,徐阳扬;嵌入式协处理器初等函数的快速统一实现[J];电子与信息学报;2004年02期
5 金钊;;32位嵌入式CPU中系统控制协处理器的设计与实现[J];电子设计应用;2006年10期
6 吴康;;应用安全协处理器构建一个金融终端中的安全嵌入式系统[J];中国公共安全(综合版);2006年06期
7 孙季丰;袁春林;盛艳青;刘斌;;一种通用安全协处理器[J];计算机工程;2008年22期
8 孙俊杰;;闪存大佬推协处理器将闪存推向更广阔市场[J];中国电子商情(基础电子);2012年08期
9 张慧娟;;新型语音协处理器提升快速精确语言识别及处理能力[J];电子设计技术;2012年09期
10 李辉楷;韩军;翁新钎;贺中柱;曾晓洋;;精简指令集计算机协处理器设计[J];计算机工程;2012年23期
相关会议论文 前4条
1 欧庆于;张昌宏;;应用安全协处理器构建安全嵌入式系统[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(上册)[C];2006年
2 孟宪元;;FPGA实现DSP系统的结构模型[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
3 庞博;张长明;;基于CORDIC算法的数字协处理器设计与测试[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
4 李建赢;王虹宇;洪朝群;姜巍;;PIC/MC模型在Intel Xeon Phi上的初步实现与优化[A];第十六届全国等离子体科学技术会议暨第一届全国等离子体医学研讨会会议摘要集[C];2013年
相关重要报纸文章 前10条
1 记者 周源;英特尔首批至强融合协处理器问世[N];网络世界;2012年
2 沈文;AMD+ATI能否双赢?[N];计算机世界;2006年
3 记者 孙永杰;“核”战何时休 客户需求最重要[N];中国电子报;2006年
4 马文方;AMD收购ATi值不值?[N];中国计算机报;2006年
5 Altera公司高级产品行销经理 Paul Ekas;FPGA协处理器优化汽车信息系统设计[N];中国电子报;2004年
6 ;新品速递[N];计算机世界;2001年
7 建苗 编译;Java扮演嵌入式应用开发主角[N];计算机世界;2005年
8 《网络世界》记者 周源;华大基因:Xeon Phi性能超预期[N];网络世界;2014年
9 特约作者 苏驰;PC系统的新高速公路[N];电脑报;2010年
10 ;TI新型 DSP冲击720MHz[N];计算机世界;2003年
相关博士学位论文 前4条
1 郑乔石;暗硅时代CoDA架构可扩展性及能效问题研究[D];西北工业大学;2015年
2 王庆林;基于高性能协处理器的粒子输运模拟加速关键技术研究[D];国防科学技术大学;2016年
3 宋宇鲲;动态可重构协处理器研究[D];合肥工业大学;2006年
4 杜学亮;定制指令与协处理器加速机制的研究[D];中国科学技术大学;2009年
相关硕士学位论文 前10条
1 杨静;基于有限差分的心电模型模拟在CPU与多MIC协处理器平台的并行与优化[D];国防科学技术大学;2013年
2 梁志力;异构多核系统中协处理器优化[D];合肥工业大学;2015年
3 王捷;一种高性能向量处理器的实现[D];天津大学;2016年
4 庞博;高性能专用数字协处理器的设计与测试[D];电子科技大学;2009年
5 淮侃;手机多媒体协处理器芯片的应用与实现[D];西安电子科技大学;2007年
6 金钊;64位高性能嵌入式CPU中系统协处理器的设计与实现[D];同济大学;2007年
7 范凯;基于动态可重构技术的阵列型协处理器架构设计与实现[D];上海交通大学;2010年
8 李鹏;8087数值协处理器的分析与设计[D];西安电子科技大学;2001年
9 赖明澈;数据并行协处理器体系结构的研究与实现[D];国防科学技术大学;2005年
10 姚于斌;面向图像处理的可重构协处理器结构设计研究[D];上海交通大学;2008年
,本文编号:1656680
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1656680.html