SIMD非对齐访存结构设计与实现
本文关键词:SIMD非对齐访存结构设计与实现
更多相关文章: 高性能计算 数据级并行 向量化 单指令流多数据流扩展 非对齐访存 Gem模拟器
【摘要】:单指令流多数据流(SIMD)是实现数据级并行的有效方法,但访问地址非对齐的数据严重影响程序的向量化,造成处理器性能下降。为降低非对齐访存延时,对高性能应用程序的访存结构进行建模,设计并实现SIMD分离缓冲行非对齐访存结构与双体cache非对齐访存结构。实验结果表明,在双体cache非对齐访存结构下,通过两数组相加与SIMD向量化实现的非对齐访存代码可达到对齐访存代码性能的99%,提高了SIMD向量化的访存效率。
【作者单位】: 国防科学技术大学计算机学院;
【关键词】: 高性能计算 数据级并行 向量化 单指令流多数据流扩展 非对齐访存 Gem模拟器
【基金】:国家自然科学基金资助项目“面向超高性能计算的众线程宽向量微体系结构研究”(61170045)
【分类号】:TP332;TP333
【正文快照】: 中文引用格式:余成龙,王永文.SIMD非对齐访存结构设计与实现[J].计算机工程,2016,42(9):1-4.英文引用格式:Yu Chenglong,Wang Yongwen.Design and Implementation of SIMD Unaligned Memory Access Structure[J].Computer Engineering,2016,42(9):1-4.1概述单指令流多数据流(S
【相似文献】
中国期刊全文数据库 前10条
1 张为华;臧斌宇;王晔;钱兴隆;朱传琪;;基于共享向量的二维SIMD调度算法[J];计算机学报;2006年10期
2 李璞;孙亚辉;;64位环境SIMD性能优化技术研究[J];计算机与信息技术;2007年04期
3 卜士喜;竺红卫;;软件SIMD的研究及应用[J];计算机工程;2010年19期
4 侯永生;赵荣彩;黄磊;韩林;;面向SIMD扩展部件的循环优化研究[J];计算机科学;2014年05期
5 张为华;臧斌宇;;共享主存多SIMD结构及编译技术研究[J];计算机科学与探索;2009年01期
6 郭阳;丁伟;李振涛;;高性能算术SIMD模块的电路设计[J];微电子学与计算机;2010年09期
7 侯永生;赵荣彩;高伟;朱嘉枫;;SIMD扩展部件数据依赖关系约束条件研究[J];信息工程大学学报;2014年01期
8 吴松,章勇,姚庆栋;嵌入式SIMD控制核的设计研究[J];浙江大学学报(工学版);2001年02期
9 周西汉,刘勃,周荷琴,袁非牛;一种基于奔腾SIMD指令的快速背景提取方法[J];计算机工程与应用;2004年27期
10 张倩;;二维SIMD结构的低功耗调度[J];计算机工程;2009年10期
中国重要会议论文全文数据库 前7条
1 梅家祥;王永文;邢座程;;SIMD模式下访存单元的验证[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
2 付光远;;基于SIMD-MPP并行模型的图像调度与映射方法研究[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
3 高巍;宋妍;;基于SIMD体系结构的数据相关控制语句转化方法[A];2009年全国开放式分布与并行计算机学术会议论文集(上册)[C];2009年
4 朱明慧;;ADI浮点DSP软件编程中的指令并行与SIMD应用[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
5 李彦洁;庞一;孙立峰;;多视点视频编码中的SIMD优化研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年
6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四届中国卫星导航学术年会论文集-S7 北斗/GNSS用户终端技术[C];2013年
7 吴铁彬;刘衡竹;杨惠;张剑锋;侯申;;一种快速SIMD浮点乘加器的设计与实现[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
中国博士学位论文全文数据库 前8条
1 杨惠;面向性能的SIMD DSP指令流调度技术研究[D];国防科学技术大学;2014年
2 侯永生;多重循环SIMD向量化方法及性能优化技术研究[D];解放军信息工程大学;2014年
3 张为华;共享主存多SIMD结构编译优化及结构研究[D];复旦大学;2006年
4 李玉祥;面向非多媒体程序的SIMD向量化方法及优化技术研究[D];中国科学技术大学;2008年
5 张凯;向量SIMD DSP上高效矩阵运算技术研究[D];国防科学技术大学;2013年
6 朱嘉华;SIMD编译优化方法研究[D];复旦大学;2005年
7 姜伟华;针对实际多媒体程序和多媒体扩展指令集的SIMD编译优化[D];复旦大学;2005年
8 魏帅;面向SIMD的向量化算法及重组技术研究[D];解放军信息工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 沈阳;基于SIMD指令的多核软件渲染器的设计与实现[D];浙江大学;2015年
2 王力;SIMD指令在生物序列串匹配里的应用[D];北京理工大学;2015年
3 黄娟娟;多线程多SIMD自动向量化技术研究[D];国防科学技术大学;2013年
4 赵芮;一款高性能64位DSP中SIMD结构FMAC的设计与验证[D];国防科学技术大学;2014年
5 林宗华;X-DSP定点乘累加的设计优化与验证[D];国防科学技术大学;2014年
6 宋贵环;YHFT-Matrix2编译器SIMD优化技术研究与实现[D];国防科学技术大学;2014年
7 黄胜兵;面向BWDSP的SIMD编译优化技术研究与实现[D];中国科学技术大学;2016年
8 胡辰;基于异构SIMD并行的高分辨率星载SAR原始数据快速模拟研究[D];北京化工大学;2016年
9 李国君;基于异构SIMD并行的高分辨率星载SAR快速成像研究[D];北京化工大学;2016年
10 徐沛文;32位高性能DSP SIMD向量存储器的设计和验证[D];国防科学技术大学;2015年
,本文编号:1008285
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1008285.html