SIMD向量指令的非满载使用方法研究
本文选题:大规模SIMD + 并行 ; 参考:《计算机科学》2015年07期
【摘要】:大规模SIMD体系结构提供了更强的向量并行硬件支持,但是,大量迭代次数不足的循环由于不能提供足够的并行性,难以用等价的向量方式实现。为了更有效地利用SIMD,提出了一种非满载地使用SIMD指令的向量化方法。研究了向量寄存器的使用方式,基于非满载的向量寄存器使用方式实现了非满载的向量操作和短循环的向量化,并将非满载的向量化方法用于一般循环的向量化。提供了收益分析方法来为本向量化方法作精确指导。实验结果表明了该方法的有效性,所选测试用例的目标循环被向量化,平均加速比达到1.2。
[Abstract]:Large-scale SIMD architecture provides stronger vector parallel hardware support, but the cycle with insufficient number of iterations cannot be implemented in a vector equivalent way because it can not provide enough parallelism.In order to make more efficient use of SIMD, a vectorization method using SIMD instructions is proposed.The use of vector registers is studied. Vector operations with non-full loads and vectorization of short cycles are realized based on the non-full load vector registers, and the non-full load vector quantization method is applied to the vectorization of general cycles.The income analysis method is provided to provide accurate guidance for this vectorization method.The experimental results show that the method is effective and the target cycle of the selected test cases is vectorized with an average speedup of 1.2.
【作者单位】: 信息工程大学数学工程与先进计算国家重点实验室;
【基金】:国家高技术研究发展计划(863)(2009AA01220) “核高基”重大专项(2009zx10036-001-001)资助
【分类号】:TP332
【参考文献】
相关期刊论文 前1条
1 辛乃军;陈旭灿;孙海燕;阳柳;罗杰;淡孝强;王霁;;基于GCC的高性能DSP Matrix向量指令集扩展[J];计算机工程与科学;2012年01期
相关博士学位论文 前1条
1 魏帅;面向SIMD的向量化算法及重组技术研究[D];解放军信息工程大学;2012年
【共引文献】
相关期刊论文 前4条
1 徐颖;李春江;董钰山;周思齐;;GCC编译器中编译指导的自动向量化实现[J];计算机科学;2014年S2期
2 徐金龙;赵荣彩;韩林;;分段约束的超字并行向量发掘路径优化算法[J];计算机应用;2015年04期
3 高伟;赵荣彩;韩林;庞建民;丁锐;;SIMD自动向量化编译优化概述[J];软件学报;2015年06期
4 徐金龙;赵荣彩;丁锐;;面向循环的混合向量化方法研究[J];小型微型计算机系统;2014年12期
相关硕士学位论文 前2条
1 高伟;面向SIMD的自动向量化优化技术研究[D];解放军信息工程大学;2013年
2 刘苏;基于ARM11和Linux的网络视频监控系统[D];江西理工大学;2014年
【二级参考文献】
相关期刊论文 前7条
1 付雄;王汝传;;一种基于局部性的数据重组框架[J];计算机科学;2009年02期
2 魏帅;赵荣彩;姚远;侯永生;;面向SIMD的数组重组和对齐优化[J];计算机科学;2012年02期
3 钱兴隆;臧斌宇;朱传琪;;一种SIMD优化中的向量寄存器部分重用方法[J];计算机工程与科学;2007年05期
4 姜伟华,梅超,郭一,朱嘉华,臧斌宇,朱传琪;一种针对多媒体扩展指令集和实际多媒体程序的自动向量化方法[J];计算机学报;2005年08期
5 魏帅;赵荣彩;姚远;;面向国产CPU SW-1600的向量重组[J];计算机应用与软件;2011年11期
6 魏帅;魏然;侯永生;;面向科学计算程序的向量化[J];信息工程大学学报;2011年06期
7 李玉祥;施慧;陈莉;;面向非多媒体程序的SIMD向量化算法的研究及改进[J];小型微型计算机系统;2009年10期
相关博士学位论文 前3条
1 朱嘉华;SIMD编译优化方法研究[D];复旦大学;2005年
2 付雄;利用程序分析和优化提高Cache性能[D];中国科学技术大学;2007年
3 李玉祥;面向非多媒体程序的SIMD向量化方法及优化技术研究[D];中国科学技术大学;2008年
相关硕士学位论文 前2条
1 杨明;基于存储访问的SIMD优化技术研究[D];解放军信息工程大学;2011年
2 赵常智;支持SIMD的DSP编译优化技术的研究与实现[D];国防科学技术大学;2005年
【相似文献】
相关期刊论文 前10条
1 吴松,章勇,姚庆栋;嵌入式SIMD控制核的设计研究[J];浙江大学学报(工学版);2001年02期
2 张倩;;二维SIMD结构的低功耗调度[J];计算机工程;2009年10期
3 李初辉;王伟;肖玮;;一种共享主存二维SIMD结构资源分配算法的改进与实现[J];计算机工程与科学;2008年09期
4 陈向;沈立;李家文;;SIMD数据置换操作的自动生成和优化[J];计算机科学;2011年05期
5 桑红石,沈绪榜,陈朝阳;LS SIMD阵列微处理器控制信号时序分析[J];小型微型计算机系统;2001年12期
6 单睿;一种基于SIMD结构的可重组乘累加器设计[J];微计算机应用;2003年03期
7 郑伟,姚庆栋,张明,蒋志迪,李东晓,赖莉亚,周莉;一种支持SIMD指令的低功耗分裂式ALU设计[J];计算机工程;2004年17期
8 王光;;一种基于PIM技术的SIMD核设计[J];中国科学技术大学学报;2013年07期
9 于泽德;;基于SIMD-MC~2的并行FFT算法[J];现代计算机(专业版);2008年10期
10 王光;;一种基于嵌入式微处理器SIMD核的可重构数据总线设计[J];电子产品世界;2012年11期
相关会议论文 前3条
1 梅家祥;王永文;邢座程;;SIMD模式下访存单元的验证[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
2 吴铁彬;刘衡竹;杨惠;张剑锋;侯申;;一种快速SIMD浮点乘加器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
3 张科勋;李勇;郭海勇;;一种半定制与全定制相结合的SIMD乘法器设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
相关硕士学位论文 前9条
1 张倩;二维SIMD结构的低功耗调度[D];复旦大学;2008年
2 李璋辉;支持浮点融合乘加的SIMD运算部件设计优化及实现[D];国防科学技术大学;2013年
3 杨明;基于存储访问的SIMD优化技术研究[D];解放军信息工程大学;2011年
4 刘楷;基于SIMD结构的高性能DSP处理器评测程序的优化与实现[D];西安电子科技大学;2012年
5 陈向;SIMD数据置换指令的自动生成与优化[D];国防科学技术大学;2010年
6 刘洋徐瑞;高性能DSP中SIMD关键计算部件的研究[D];国防科学技术大学;2012年
7 成兴华;FT-XDSP高性能64位定点SIMD乘加部件的设计与实现[D];国防科学技术大学;2013年
8 刘纯悦;基于SIMD的媒体处理器的数据存储与组织体系结构优化研究[D];浙江大学;2007年
9 黄远广;多宽度SIMD结构DSP向量存储器的设计与实现[D];国防科学技术大学;2012年
,本文编号:1755636
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1755636.html