当前位置:主页 > 科技论文 > 计算机论文 >

分簇VLIW DSP上支持单双字模式选择的SIMD编译优化

发布时间:2019-01-12 12:52
【摘要】:BWDSP100是一款采用超长指令字(VLIW)和单指令多数据流(SIMD)架构的针对高性能计算领域而设计的32位静态标量数字信号处理器,其指令级并行(ILP)主要是通过其特殊的分簇体系结构和SIMD指令来实现,然而现有的编译框架无法对这些特殊的SIMD指令提供支持。由于BWDSP100拥有丰富的SIMD向量化资源,且其所运用的雷达数字信号处理领域对程序的性能要求极高,因此针对BWDSP100结构的特点,在传统Open64编译器中SIMD编译优化框架的基础上提出并实现了一种支持单双字模式选择的SIMD编译优化算法,通过该算法可以显著提高一些在DSP上有着广泛运用计算密集型程序的性能。实验结果表明,与优化前相比,该算法方案在BWDSP编译器上的实现能够平均取得5.66的加速比。
[Abstract]:BWDSP100 is a 32-bit static scalar digital signal processor designed for high performance computing field based on super-long instruction word (VLIW) and single-instruction multi-stream (SIMD) architecture. The instruction level parallel (ILP) is mainly implemented through its special cluster architecture and SIMD instructions. However, the existing compilation frameworks can not support these special SIMD instructions. Because BWDSP100 has abundant SIMD vectorization resources, and the radar digital signal processing field used by BWDSP100 requires very high performance of the program, it aims at the characteristics of BWDSP100 structure. Based on the framework of SIMD compiler optimization in traditional Open64 compiler, a SIMD compiler optimization algorithm is proposed and implemented. This algorithm can significantly improve the performance of some computationally intensive programs on DSP. Experimental results show that the algorithm can achieve an average speedup of 5.66 on BWDSP compiler.
【作者单位】: 中国科学技术大学计算机科学与技术学院;安徽省高性能计算重点实验室(中国科学技术大学);
【基金】:国家“核高基”重大专项(2012ZX01034-001-001)
【分类号】:TP332;TP314

【参考文献】

相关期刊论文 前2条

1 姜军;王超;尉红梅;;一种局部寄存器分配的优化策略[J];计算机应用与软件;2013年12期

2 王昊;黄光红;王向前;;基于BWDSP100的传播分簇算法研究与实现[J];中国集成电路;2014年08期

【共引文献】

相关期刊论文 前10条

1 吴丹;王志英;王绍刚;王淼;;一种确定多媒体应用程序内层循环的子字并行编译方法[J];电子学报;2006年S1期

2 王昊;王向前;;BWDSP SIMD编译的寄存器分配优化技术研究[J];单片机与嵌入式系统应用;2015年04期

3 唐文胜;吴丹;;一种改进数据流图的子字并行程序表示方法[J];计算机工程与应用;2006年29期

4 唐文胜;匡旺秋;;基于子字并行的串行图像处理算法表示方法[J];计算机工程与应用;2007年35期

5 姜伟华,梅超,郭一,朱嘉华,臧斌宇,朱传琪;一种针对多媒体扩展指令集和实际多媒体程序的自动向量化方法[J];计算机学报;2005年08期

6 张为华;朱嘉华;张宏江;臧斌宇;;基于位宽控制提高SIMD架构并行度的优化算法[J];计算机学报;2009年11期

7 索维毅;赵荣彩;姚远;张小妹;;基于跨基本块变换和循环分布的SLP优化技术[J];计算机科学;2013年10期

8 赵博;赵荣彩;李雁冰;高伟;;类型转换语句的SLP发掘方法[J];计算机科学;2014年11期

9 刘鹏;赵荣彩;李朋远;;一种面向向量化的动态指针别名分析框架[J];计算机科学;2015年03期

10 李朋远;赵荣彩;高伟;张庆花;;一种支持跨幅访存的向量化代码生成方法[J];计算机科学;2015年05期

相关博士学位论文 前6条

1 黄立波;片上集群体系结构关键技术研究[D];国防科学技术大学;2010年

2 姜伟华;针对实际多媒体程序和多媒体扩展指令集的SIMD编译优化[D];复旦大学;2005年

3 朱嘉华;SIMD编译优化方法研究[D];复旦大学;2005年

4 李玉祥;面向非多媒体程序的SIMD向量化方法及优化技术研究[D];中国科学技术大学;2008年

5 王淼;面向多核处理器的并行编译及优化关键技术研究[D];国防科学技术大学;2010年

6 姚远;SIMD自动向量识别及代码调优技术研究[D];解放军信息工程大学;2012年

相关硕士学位论文 前6条

1 陈向;SIMD数据置换指令的自动生成与优化[D];国防科学技术大学;2010年

2 周建鹏;媒体处理器编译器中SIMD编译优化技术的研究与实践[D];浙江大学;2007年

3 王迪;SIMD编译优化技术研究[D];浙江大学;2008年

4 匡旺秋;多媒体应用程序子字并行自动识别关键技术研究[D];湖南师范大学;2009年

5 淡孝强;YHFT-Matrix编译器SIMD指令自动向量化技术的研究与实现[D];国防科学技术大学;2012年

6 刘秉峰;YHFT-Matrix编译器向量化技术的研究与实现[D];国防科学技术大学;2013年

【二级参考文献】

相关期刊论文 前1条

1 胡定磊;陈书明;刘春林;;分簇结构超长指令字DSP编译器的设计与实现[J];小型微型计算机系统;2006年02期

【相似文献】

相关期刊论文 前10条

1 侯永生;赵荣彩;高伟;朱嘉枫;;SIMD扩展部件数据依赖关系约束条件研究[J];信息工程大学学报;2014年01期

2 吴松,章勇,姚庆栋;嵌入式SIMD控制核的设计研究[J];浙江大学学报(工学版);2001年02期

3 周西汉,刘勃,周荷琴,袁非牛;一种基于奔腾SIMD指令的快速背景提取方法[J];计算机工程与应用;2004年27期

4 张倩;;二维SIMD结构的低功耗调度[J];计算机工程;2009年10期

5 魏帅;赵荣彩;姚远;侯永生;;面向SIMD的数组重组和对齐优化[J];计算机科学;2012年02期

6 张武健 ,邱晓海 ,周润德 ,陈弘毅;A New Implementation of the Post-Stage Tasks of Motion Estimation Using SIMD Architecture[J];Tsinghua Science and Technology;2001年04期

7 李俊山,李莉,沈绪榜,焦康;图象理解SIMD计算机的设计技术[J];小型微型计算机系统;2002年09期

8 王馨梅,张发存,崔杜武;SIMD计算机的面向对象仿真方法[J];计算机工程;2005年17期

9 李初辉;王伟;肖玮;;一种共享主存二维SIMD结构资源分配算法的改进与实现[J];计算机工程与科学;2008年09期

10 付光远;;基于SIMD-MPP并行模型的图像调度与映射方法研究[J];微电子学与计算机;2006年S1期

相关会议论文 前8条

1 梅家祥;王永文;邢座程;;SIMD模式下访存单元的验证[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

2 付光远;;基于SIMD-MPP并行模型的图像调度与映射方法研究[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

3 高巍;宋妍;;基于SIMD体系结构的数据相关控制语句转化方法[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年

4 朱明慧;;ADI浮点DSP软件编程中的指令并行与SIMD应用[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年

5 李彦洁;庞一;孙立峰;;多视点视频编码中的SIMD优化研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年

6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四届中国卫星导航学术年会论文集-S7 北斗/GNSS用户终端技术[C];2013年

7 吴铁彬;刘衡竹;杨惠;张剑锋;侯申;;一种快速SIMD浮点乘加器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年

8 张科勋;李勇;郭海勇;;一种半定制与全定制相结合的SIMD乘法器设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

相关博士学位论文 前5条

1 张为华;共享主存多SIMD结构编译优化及结构研究[D];复旦大学;2006年

2 李玉祥;面向非多媒体程序的SIMD向量化方法及优化技术研究[D];中国科学技术大学;2008年

3 朱嘉华;SIMD编译优化方法研究[D];复旦大学;2005年

4 姜伟华;针对实际多媒体程序和多媒体扩展指令集的SIMD编译优化[D];复旦大学;2005年

5 魏帅;面向SIMD的向量化算法及重组技术研究[D];解放军信息工程大学;2012年

相关硕士学位论文 前10条

1 张倩;二维SIMD结构的低功耗调度[D];复旦大学;2008年

2 李璋辉;支持浮点融合乘加的SIMD运算部件设计优化及实现[D];国防科学技术大学;2013年

3 杨明;基于存储访问的SIMD优化技术研究[D];解放军信息工程大学;2011年

4 刘楷;基于SIMD结构的高性能DSP处理器评测程序的优化与实现[D];西安电子科技大学;2012年

5 陈向;SIMD数据置换指令的自动生成与优化[D];国防科学技术大学;2010年

6 彭永克;基于SIMD架构的二维DCT/IDCT变换电路模块的设计与实现[D];上海交通大学;2008年

7 肖玮;二维SIMD结构的编译优化与功耗研究[D];复旦大学;2008年

8 王迪;SIMD编译优化技术研究[D];浙江大学;2008年

9 高伟;面向SIMD的自动向量化优化技术研究[D];解放军信息工程大学;2013年

10 刘洋徐瑞;高性能DSP中SIMD关键计算部件的研究[D];国防科学技术大学;2012年



本文编号:2407798

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2407798.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e85b1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com