当前位置:主页 > 科技论文 > 计算机论文 >

面向SIMD扩展部件的循环优化研究

发布时间:2018-01-12 18:21

  本文关键词:面向SIMD扩展部件的循环优化研究 出处:《计算机科学》2014年05期  论文类型:期刊论文


  更多相关文章: SIMD 依赖关系 循环优化 Tarjan


【摘要】:高性能微处理器中普遍采用SIMD向量扩展作为计算加速部件。在深入研究SIMD扩展部件数据依赖关系约束条件的基础上,提出一种基于依赖关系逆向图的Tarjan扩展算法,提高了SIMD并行性识别率,并结合传统向量化方法,实现了面向SIMD扩展部件的循环优化技术,消除了不可向量化语句对可向量化语句在数据重组中不必要的开销。实际程序测试结果显示,其在基于依赖关系的SIMD并行性判定方面优于ICC编译器,经过循环优化后,最终生成的SIMD代码其执行效率平均提高了12%。
[Abstract]:In high performance microprocessors, SIMD vector expansion is widely used as the computing accelerator. Based on the in-depth study of data dependency constraints of SIMD extension components. This paper presents an extended Tarjan algorithm based on dependency reverse graph, which improves the recognition rate of SIMD parallelism, and combines with traditional vectorization method. The loop optimization technology for SIMD extension components is implemented, and the unnecessary overhead of non-vectorized statements in data recombination is eliminated. The actual program test results show. It is superior to the ICC compiler in judging the parallelism of SIMD based on dependency relationship. After loop optimization, the final generated SIMD code has an average execution efficiency of 12 points higher than that of the ICC compiler.
【作者单位】: 数字工程与先进计算国家重点实验室;
【基金】:“核高基”重大专项“支持国产CPU的编译系统及工具链”分课题“自动并行化与二进制翻译系统”(2009ZX10036-001-001-2)资助
【分类号】:TP332
【正文快照】: 1引言随着高性能微处理中SIMD扩展指令功能日益完善,SIMD扩展部件逐渐从多媒体专用加速部件[4]转变为通用计算加速部件[3],在科学计算[12]、数字信号[11]、密码破译[10]等非多媒体应用领域得到广泛使用。SIMD扩展部件利用128或256位的SIMD寄存器对多个字符型、整型、浮点型数

【共引文献】

相关期刊论文 前2条

1 林日昶;陈碧欢;彭鑫;赵文耘;;支持风险偏好的Web服务动态组合方法[J];中国科学:信息科学;2014年01期

2 侯永生;赵荣彩;高伟;朱嘉枫;;SIMD扩展部件数据依赖关系约束条件研究[J];信息工程大学学报;2014年01期

【相似文献】

相关期刊论文 前10条

1 傅勇,吴永英;面向图像处理的SIMD结构参数优化[J];华中科技大学学报;2001年06期

2 何冬明,杨新志,薛忠杰;基于算法的DSP硬件结构分析[J];电子与封装;2004年01期

3 吴松,章勇,姚庆栋;嵌入式SIMD控制核的设计研究[J];浙江大学学报(工学版);2001年02期

4 程翥,楼生强,皇甫堪;H.263编码器中运动补偿的MMX加速[J];国防科技大学学报;2000年04期

5 杜慧敏,张智泉,沈绪榜;一种适用于数字图像处理的DSP片上系统[J];微电子学与计算机;2004年01期

6 李勇;齐同斌;张瑞生;;一种SIMD多DSP数字图像处理系统研究与设计[J];电子技术应用;2007年11期

7 冯刚,刘泽民,黄振兴;修正双边Jacobi SVD算法及其阵列处理[J];信号处理;1998年02期

8 季振洲,周勇林,方滨兴,胡铭曾;基于FPGA的ABC95阵列机PE芯片的设计[J];高技术通讯;2000年06期

9 江志红,康立功;新一代数字信号处理器ADSP21161[J];信息技术;2003年07期

10 马绍汉;谢青松;;SIMD模型上深度优先的并行搜索算法[J];计算机科学;1996年04期

相关会议论文 前10条

1 梅家祥;王永文;邢座程;;SIMD模式下访存单元的验证[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

2 吴铁彬;刘衡竹;杨惠;张剑锋;侯申;;一种快速SIMD浮点乘加器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年

3 庄巍;刘衡竹;杨惠;;基数分离的快速定点SIMD除法器[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

4 周锋;彭元喜;杨惠;;面向X处理器的SIMD移位器[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

5 张科勋;李勇;郭海勇;;一种半定制与全定制相结合的SIMD乘法器设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

6 朱明慧;;ADI浮点DSP软件编程中的指令并行与SIMD应用[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年

7 李彦洁;庞一;孙立峰;;多视点视频编码中的SIMD优化研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年

8 高巍;宋妍;;基于SIMD体系结构的数据相关控制语句转化方法[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年

9 涂卫平;胡瑞敏;艾浩军;乐攀;;基于SIMD的低码率语音编码优化[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年

10 吴茂林;金林;孙俊;于俊朋;;基于Cell多核的SAR成像并行处理技术的研究[A];2010年通信理论与信号处理学术年会论文集[C];2010年

相关重要报纸文章 前6条

1 秋叶;“架构”的战争[N];电脑报;2010年

2 土匀;了解“爱妻”[N];电脑报;2008年

3 秋叶;CUDA普及之路[N];电脑报;2010年

4 ;AMD新武器到来[N];电脑报;2010年

5 编译 褚红梅 霍光;处理器群雄抢占三网融合新高地[N];中国计算机报;2010年

6 大老客;DX11时代谁能夺标[N];电脑报;2010年

相关博士学位论文 前10条

1 姚远;SIMD自动向量识别及代码调优技术研究[D];解放军信息工程大学;2012年

2 刘胜;超宽SIMD DSP片上并行数据访存关键技术研究[D];国防科学技术大学;2012年

3 魏帅;面向SIMD的向量化算法及重组技术研究[D];解放军信息工程大学;2012年

4 黄立波;片上集群体系结构关键技术研究[D];国防科学技术大学;2010年

5 李世胜;基于运行时的程序执行模型研究[D];中国科学技术大学;2010年

6 何义;流体系结构指令管理及系统虚拟化仿真技术研究[D];国防科学技术大学;2010年

7 赵龙;密码学相关椭圆曲线若干问题研究[D];解放军信息工程大学;2011年

8 焦继业;低功耗高性能移动图形顶点处理器设计关键技术研究[D];西安电子科技大学;2013年

9 葛海通;32位高性能嵌入式CPU及平台研发[D];浙江大学;2009年

10 王淼;面向多核处理器的并行编译及优化关键技术研究[D];国防科学技术大学;2010年

相关硕士学位论文 前10条

1 陈向;SIMD数据置换指令的自动生成与优化[D];国防科学技术大学;2010年

2 杨明;基于存储访问的SIMD优化技术研究[D];解放军信息工程大学;2011年

3 高伟;面向SIMD的自动向量化优化技术研究[D];解放军信息工程大学;2013年

4 淡孝强;YHFT-Matrix编译器SIMD指令自动向量化技术的研究与实现[D];国防科学技术大学;2012年

5 李国强;SIMD DSP中的高性能定点算术运算部件的设计与实现[D];国防科学技术大学;2012年

6 郝云龙;反馈指导的SIMD向量识别及优化技术研究[D];解放军信息工程大学;2011年

7 朱嘉风;面向SIMD的编译指导与条件分支的编译优化技术[D];解放军信息工程大学;2011年

8 白鹏飞;SIMD结构并行图像降噪处理机的设计与实现[D];西安电子科技大学;2013年

9 李勇;H.264核心算法在SIMD向量DSP上的设计与实现[D];国防科学技术大学;2012年

10 刘楷;基于SIMD结构的高性能DSP处理器评测程序的优化与实现[D];西安电子科技大学;2012年



本文编号:1415430

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1415430.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9c8ac***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com