基于存储访问的SIMD优化技术研究
发布时间:2020-07-04 04:15
【摘要】:随着对浮点运算支持的完善,SIMD扩展部件的应用越来越广泛,但非连续和非对齐的数据引用降低了SIMD向量化的存储访问效率,使程序的向量化效率与预期还存在着较大差距。影响存储访问效率的重要因素是cache命中率和内存访问量,cache命中率下降或冗余内存访问都会影响程序性能。 结构体数组在应用程序中应用广泛,为了解决结构体存储的对齐要求产生的空间浪费问题,通过结构体的存储预优化,可以压缩数据的存储空间,提升向量化系统的SIMD向量化识别能力。 为了解决结构体数组中非对齐的数组成员引用在SIMD向量化过程中向量化不完全或存在的额外开销问题,通过数据填充的方法进行对齐优化,有效减少了SIMD向量化过程中的非对齐访问。 为了解决结构体数组中非数组成员引用进行SIMD向量化的开销较大,影响程序性能提升的问题,通过结构体数组的SIMD存储访问优化,有效减少了SIMD向量化过程中的非连续和非对齐访问。 为了解决循环迭代间访问数组下标与某层循环索引无关而需要重复访存的问题,通过循环交换的优化方法,不影响cache命中率的同时实现对向量寄存器的重用,有效减少了内存访问量。 为了解决在循环迭代间访问同一数组元素时,向量寄存器对cache中的数据进行多次重复装载,存在冗余内存访问的问题,通过循环展开压紧的优化方法,实现对向量寄存器的重用,有效减少了内存访问量。 课题研究的向量识别与自动向量化系统SW-VEC在课题实验平台上进行测试。通过对gcc-vect和Callahan-Dongarra-Levine测试集的测试,表明SW-VEC在结构体数组方面的向量识别能力不弱于INTEL11.0编译器;通过对SPEC CPU2000浮点测试集和NPB3.2-SER标准测试集的测试,表明课题研究优化技术的正确性和有效性。
【学位授予单位】:解放军信息工程大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP332
本文编号:2740622
【学位授予单位】:解放军信息工程大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP332
【参考文献】
相关期刊论文 前9条
1 薛丽萍;张兆庆;;ORC的代码生成的关键技术[J];计算机科学;2004年08期
2 吴圣宁;李思昆;;多媒体处理器的SIMD代码生成[J];计算机科学;2007年07期
3 付雄;王汝传;;一种基于局部性的数据重组框架[J];计算机科学;2009年02期
4 赵辉;黄石;;SIMD计算机的优化编译器设计[J];计算机工程;2009年01期
5 张宏江;臧斌宇;朱传琪;;多媒体程序中消除控制相关的技术研究[J];计算机工程与科学;2006年11期
6 钱兴隆;臧斌宇;朱传琪;;一种SIMD优化中的向量寄存器部分重用方法[J];计算机工程与科学;2007年05期
7 张为华;朱嘉华;张宏江;臧斌宇;;基于位宽控制提高SIMD架构并行度的优化算法[J];计算机学报;2009年11期
8 高巍;宋妍;;基于SIMD体系结构的数据相关控制语句转化方法[J];微电子学与计算机;2009年08期
9 李玉祥;施慧;陈莉;;面向向量化的局部数据重组[J];小型微型计算机系统;2009年08期
相关博士学位论文 前1条
1 付雄;利用程序分析和优化提高Cache性能[D];中国科学技术大学;2007年
本文编号:2740622
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2740622.html