一种面向SIMD扩展部件的向量化统一架构
【图文】:
t类型归约加3convolution二维卷积运算4MMM_f32float类型矩阵乘5MMM_f64double类型矩阵乘5.2实验结果与分析实验面向申威1600、华为某DSP和Alpha3种平台的SIMD部件进行测试,,主要测试3种平台的向量化加速比,验证向量化工具的有效性,并对比SIMD部件的加速效果。实现架构为源源变换,对向量化后的代码膨胀率进行测试,分析不同的指令集特征对代码膨胀率的影响。各平台SIMD部件加速比和膨胀率分别如图4和图5所示。图4各平台SIMD部件向量化加速比(下转第44页)·31·
【作者单位】: 信息工程大学;数学工程与先进计算国家重点实验室;
【基金】:核高基国家科技重大专项(2009ZX01036)资助
【分类号】:TP332
【相似文献】
相关期刊论文 前10条
1 季振洲,史捷,方滨兴,胡铭曾,曲云波;一种阵列计算机输入输出系统的设计[J];哈尔滨工业大学学报;2000年01期
2 何冬明,杨新志,薛忠杰;基于算法的DSP硬件结构分析[J];电子与封装;2004年01期
3 吴松,章勇,姚庆栋;嵌入式SIMD控制核的设计研究[J];浙江大学学报(工学版);2001年02期
4 杜慧敏,张智泉,沈绪榜;一种适用于数字图像处理的DSP片上系统[J];微电子学与计算机;2004年01期
5 季振洲,周勇林,方滨兴,胡铭曾;基于FPGA的ABC95阵列机PE芯片的设计[J];高技术通讯;2000年06期
6 江志红,康立功;新一代数字信号处理器ADSP21161[J];信息技术;2003年07期
7 曾国荪,陆鑫达,周定康;自动提取程序异构性的框架[J];计算机与现代化;1999年04期
8 马兰,沈笑云,侯春萍;高速三维实时图象帧缓存设计[J];中国图象图形学报;2000年08期
9 林智华;对阵列处理机和多处理机的深入比较[J];福建金融管理干部学院学报;2004年01期
10 钱艺;李占才;李昂;王沁;;一种神经网络并行处理器的体系结构[J];小型微型计算机系统;2007年10期
相关会议论文 前6条
1 梅家祥;王永文;邢座程;;SIMD模式下访存单元的验证[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
2 吴铁彬;刘衡竹;杨惠;张剑锋;侯申;;一种快速SIMD浮点乘加器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
3 庄巍;刘衡竹;杨惠;;基数分离的快速定点SIMD除法器[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
4 周锋;彭元喜;杨惠;;面向X处理器的SIMD移位器[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
5 张科勋;李勇;郭海勇;;一种半定制与全定制相结合的SIMD乘法器设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
6 辛乃军;陈旭灿;孙海燕;阳柳;罗杰;淡孝强;王霁;;基于GCC的高性能DSP Matrix向量指令集扩展[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
相关重要报纸文章 前5条
1 秋叶;“架构”的战争[N];电脑报;2010年
2 土匀;了解“爱妻”[N];电脑报;2008年
3 秋叶;CUDA普及之路[N];电脑报;2010年
4 ;AMD新武器到来[N];电脑报;2010年
5 大老客;DX11时代谁能夺标[N];电脑报;2010年
相关博士学位论文 前7条
1 刘胜;超宽SIMD DSP片上并行数据访存关键技术研究[D];国防科学技术大学;2012年
2 黄立波;片上集群体系结构关键技术研究[D];国防科学技术大学;2010年
3 何义;流体系结构指令管理及系统虚拟化仿真技术研究[D];国防科学技术大学;2010年
4 葛海通;32位高性能嵌入式CPU及平台研发[D];浙江大学;2009年
5 王淼;面向多核处理器的并行编译及优化关键技术研究[D];国防科学技术大学;2010年
6 张波涛;片上高性能嵌入式计算—面向软基带的应用并行处理模型及体系结构[D];国防科学技术大学;2011年
7 吴丹;高效能计算型存储器体系结构关键技术研究与实现[D];华中科技大学;2012年
相关硕士学位论文 前10条
1 陈向;SIMD数据置换指令的自动生成与优化[D];国防科学技术大学;2010年
2 杨明;基于存储访问的SIMD优化技术研究[D];解放军信息工程大学;2011年
3 李国强;SIMD DSP中的高性能定点算术运算部件的设计与实现[D];国防科学技术大学;2012年
4 黄远广;多宽度SIMD结构DSP向量存储器的设计与实现[D];国防科学技术大学;2012年
5 张庆丹;基于GPU的串匹配算法的实现[D];中国科学院研究生院(计算技术研究所);2006年
6 卢捚;基于Cell多核处理器的MPEG-2视频解码技术的研究[D];浙江大学;2008年
7 杨强;DSP高性能乘法部件的设计与实现[D];国防科学技术大学;2008年
8 周海亮;基于X流处理器的循环实现及优化[D];国防科学技术大学;2006年
9 黄敬磊;GPU通用计算中的数据结构组织与应用研究[D];解放军信息工程大学;2007年
10 罗飞;“银河飞腾”DSP乘法部件及算术逻辑运算部件的设计[D];国防科学技术大学;2006年
本文编号:2533178
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2533178.html