当前位置:主页 > 科技论文 > 计算机论文 >

一种面向SIMD扩展部件的向量化统一架构

发布时间:2019-09-07 18:15
【摘要】:随着多媒体应用的普及和高性能计算的需求,越来越多的处理器集成了SIMD扩展。为了针对不同SIMD扩展部件自动生成高效的向量化代码,设计了一套虚拟向量指令集,在此基础上构建了一种面向SIMD扩展部件的向量化统一架构。将输入程序通过向量识别等阶段转变为虚拟向量指令的中间表示,而后通过向量长度解虚拟化和指令集解虚拟化,将其转变为特定SIMD部件的向量指令集。在申威1600、DSP和Alpha上的实验结果表明:统一架构能够针对3种平台自动变换出高效的向量化代码,在DSP上的加速比要明显优于其它两种平台。
【图文】:

向量化,加速比,部件,平台


t类型归约加3convolution二维卷积运算4MMM_f32float类型矩阵乘5MMM_f64double类型矩阵乘5.2实验结果与分析实验面向申威1600、华为某DSP和Alpha3种平台的SIMD部件进行测试,,主要测试3种平台的向量化加速比,验证向量化工具的有效性,并对比SIMD部件的加速效果。实现架构为源源变换,对向量化后的代码膨胀率进行测试,分析不同的指令集特征对代码膨胀率的影响。各平台SIMD部件加速比和膨胀率分别如图4和图5所示。图4各平台SIMD部件向量化加速比(下转第44页)·31·
【作者单位】: 信息工程大学;数学工程与先进计算国家重点实验室;
【基金】:核高基国家科技重大专项(2009ZX01036)资助
【分类号】:TP332

【相似文献】

相关期刊论文 前10条

1 季振洲,史捷,方滨兴,胡铭曾,曲云波;一种阵列计算机输入输出系统的设计[J];哈尔滨工业大学学报;2000年01期

2 何冬明,杨新志,薛忠杰;基于算法的DSP硬件结构分析[J];电子与封装;2004年01期

3 吴松,章勇,姚庆栋;嵌入式SIMD控制核的设计研究[J];浙江大学学报(工学版);2001年02期

4 杜慧敏,张智泉,沈绪榜;一种适用于数字图像处理的DSP片上系统[J];微电子学与计算机;2004年01期

5 季振洲,周勇林,方滨兴,胡铭曾;基于FPGA的ABC95阵列机PE芯片的设计[J];高技术通讯;2000年06期

6 江志红,康立功;新一代数字信号处理器ADSP21161[J];信息技术;2003年07期

7 曾国荪,陆鑫达,周定康;自动提取程序异构性的框架[J];计算机与现代化;1999年04期

8 马兰,沈笑云,侯春萍;高速三维实时图象帧缓存设计[J];中国图象图形学报;2000年08期

9 林智华;对阵列处理机和多处理机的深入比较[J];福建金融管理干部学院学报;2004年01期

10 钱艺;李占才;李昂;王沁;;一种神经网络并行处理器的体系结构[J];小型微型计算机系统;2007年10期

相关会议论文 前6条

1 梅家祥;王永文;邢座程;;SIMD模式下访存单元的验证[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

2 吴铁彬;刘衡竹;杨惠;张剑锋;侯申;;一种快速SIMD浮点乘加器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年

3 庄巍;刘衡竹;杨惠;;基数分离的快速定点SIMD除法器[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

4 周锋;彭元喜;杨惠;;面向X处理器的SIMD移位器[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

5 张科勋;李勇;郭海勇;;一种半定制与全定制相结合的SIMD乘法器设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

6 辛乃军;陈旭灿;孙海燕;阳柳;罗杰;淡孝强;王霁;;基于GCC的高性能DSP Matrix向量指令集扩展[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年

相关重要报纸文章 前5条

1 秋叶;“架构”的战争[N];电脑报;2010年

2 土匀;了解“爱妻”[N];电脑报;2008年

3 秋叶;CUDA普及之路[N];电脑报;2010年

4 ;AMD新武器到来[N];电脑报;2010年

5 大老客;DX11时代谁能夺标[N];电脑报;2010年

相关博士学位论文 前7条

1 刘胜;超宽SIMD DSP片上并行数据访存关键技术研究[D];国防科学技术大学;2012年

2 黄立波;片上集群体系结构关键技术研究[D];国防科学技术大学;2010年

3 何义;流体系结构指令管理及系统虚拟化仿真技术研究[D];国防科学技术大学;2010年

4 葛海通;32位高性能嵌入式CPU及平台研发[D];浙江大学;2009年

5 王淼;面向多核处理器的并行编译及优化关键技术研究[D];国防科学技术大学;2010年

6 张波涛;片上高性能嵌入式计算—面向软基带的应用并行处理模型及体系结构[D];国防科学技术大学;2011年

7 吴丹;高效能计算型存储器体系结构关键技术研究与实现[D];华中科技大学;2012年

相关硕士学位论文 前10条

1 陈向;SIMD数据置换指令的自动生成与优化[D];国防科学技术大学;2010年

2 杨明;基于存储访问的SIMD优化技术研究[D];解放军信息工程大学;2011年

3 李国强;SIMD DSP中的高性能定点算术运算部件的设计与实现[D];国防科学技术大学;2012年

4 黄远广;多宽度SIMD结构DSP向量存储器的设计与实现[D];国防科学技术大学;2012年

5 张庆丹;基于GPU的串匹配算法的实现[D];中国科学院研究生院(计算技术研究所);2006年

6 卢捚;基于Cell多核处理器的MPEG-2视频解码技术的研究[D];浙江大学;2008年

7 杨强;DSP高性能乘法部件的设计与实现[D];国防科学技术大学;2008年

8 周海亮;基于X流处理器的循环实现及优化[D];国防科学技术大学;2006年

9 黄敬磊;GPU通用计算中的数据结构组织与应用研究[D];解放军信息工程大学;2007年

10 罗飞;“银河飞腾”DSP乘法部件及算术逻辑运算部件的设计[D];国防科学技术大学;2006年



本文编号:2533178

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2533178.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户948a4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com