当前位置:主页 > 科技论文 > 计算机论文 >

一种改进的控制流SIMD向量化方法

发布时间:2018-08-15 13:36
【摘要】:SIMD扩展部件是近年来集成到通用处理器中的加速部件,旨在发掘多媒体和科学计算等程序的数据级并行.控制依赖给发掘程序中的数据级并行带来了阻碍,当前,无论基于loop-based还是SLP的控制流向量化方法都需要if转换,而没有考虑循环内蕴含的向量并行度,导致生成的向量代码效率较低.此外,不精确的代价模型指导控制流向量化,同样导致生成的向量代码效率较低.为此,提出了改进的控制流SIMD向量化方法.首先,提出了含有控制依赖的循环分布算法,分离循环的可向量化部分和不可向量化部分,同时考虑分布时数据的局部性;其次,提出了一种直接向量化控制流的方法,该方法考虑了基本块间的向量重用;最后,利用精确的代价模型指导超字选择指令和超字条件分支指令的生成.实验结果表明:与现有的控制流向量化方法相比,改进方法生成的向量代码性能提高了24%.
[Abstract]:The SIMD extension is an accelerator integrated into a general purpose processor in recent years, which aims to explore the data-level parallelism of programs such as multimedia and scientific computing. Control dependence is a hindrance to data-level parallelism in mining programs. At present, both loop-based and SLP control flow direction quantization methods need if transformation without considering the vector parallelism in the loop. The resulting vector code is inefficient. In addition, the inexact cost model guides the quantization of the control flow, which also leads to the low efficiency of the generated vector code. Therefore, an improved control flow SIMD vectorization method is proposed. First of all, a cyclic distribution algorithm with control dependency is proposed to separate the quantifiable part of the loop from the non-vectorized part, and the locality of the data is considered at the same time. Secondly, a method of direct vectorization control flow is proposed. This method takes into account the vector reuse between the basic blocks. Finally, the exact cost model is used to guide the generation of superword selection instructions and superword conditional branch instructions. The experimental results show that the performance of vector code generated by the improved method is improved by 24% compared with the existing methods.
【作者单位】: 数学工程与先进计算国家重点实验室(解放军信息工程大学);
【基金】:“核高基”国家科技重大专项(2009ZX01036)~~
【分类号】:TP314;TP332

【相似文献】

相关期刊论文 前10条

1 BenjaminHAO,DavidPEARSON,RichardZIPPEL;Global Register Allocation for SIMD Multiprocessors[J];Journal of Computer Science and Technology;1996年03期

2 卜士喜;竺红卫;;软件SIMD的研究及应用[J];计算机工程;2010年19期

3 侯永生;赵荣彩;黄磊;韩林;;面向SIMD扩展部件的循环优化研究[J];计算机科学;2014年05期

4 张为华;臧斌宇;;共享主存多SIMD结构及编译技术研究[J];计算机科学与探索;2009年01期

5 郭阳;丁伟;李振涛;;高性能算术SIMD模块的电路设计[J];微电子学与计算机;2010年09期

6 吴松,章勇,姚庆栋;嵌入式SIMD控制核的设计研究[J];浙江大学学报(工学版);2001年02期

7 张倩;;二维SIMD结构的低功耗调度[J];计算机工程;2009年10期

8 李初辉;王伟;肖玮;;一种共享主存二维SIMD结构资源分配算法的改进与实现[J];计算机工程与科学;2008年09期

9 陈向;沈立;李家文;;SIMD数据置换操作的自动生成和优化[J];计算机科学;2011年05期

10 桑红石,沈绪榜,陈朝阳;LS SIMD阵列微处理器控制信号时序分析[J];小型微型计算机系统;2001年12期

相关会议论文 前2条

1 梅家祥;王永文;邢座程;;SIMD模式下访存单元的验证[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

2 吴铁彬;刘衡竹;杨惠;张剑锋;侯申;;一种快速SIMD浮点乘加器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年

相关博士学位论文 前1条

1 杨惠;面向性能的SIMD DSP指令流调度技术研究[D];国防科学技术大学;2014年

相关硕士学位论文 前10条

1 沈阳;基于SIMD指令的多核软件渲染器的设计与实现[D];浙江大学;2015年

2 黄娟娟;多线程多SIMD自动向量化技术研究[D];国防科学技术大学;2013年

3 赵芮;一款高性能64位DSP中SIMD结构FMAC的设计与验证[D];国防科学技术大学;2014年

4 林宗华;X-DSP定点乘累加的设计优化与验证[D];国防科学技术大学;2014年

5 徐沛文;32位高性能DSP SIMD向量存储器的设计和验证[D];国防科学技术大学;2015年

6 单佳坤;基于亚字并行技术的128位SIMD算术单元设计[D];西安电子科技大学;2016年

7 张倩;二维SIMD结构的低功耗调度[D];复旦大学;2008年

8 李璋辉;支持浮点融合乘加的SIMD运算部件设计优化及实现[D];国防科学技术大学;2013年

9 杨明;基于存储访问的SIMD优化技术研究[D];解放军信息工程大学;2011年

10 刘楷;基于SIMD结构的高性能DSP处理器评测程序的优化与实现[D];西安电子科技大学;2012年



本文编号:2184362

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2184362.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户eb3bc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com