面向循环级数组访问的数据预取技术研究
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP332
【图文】:
lllIII图2.1程序片段执行框图(a)没有预取(b)理想预取(c)非理想预取图2.1(a)和图2.1(b)的对比,直观的显示了预取可以减少执行时间。这里,计算和访存的并行隐藏了访存延迟,提高了程序执行效率。图中显示的是一种理想情况,即预取的数据恰好及时响应微处理器的访问请求。图2.l(c)显示的是一种不太乐观的情景,rl,r2的预取操作发出的太晚,以至于不能完全避免处理器的空转。而:3又预取的过早,虽然隐藏了访存时延,但在被使用之前,它将保存在Cache中一段时间
EEEPPPNPB3.2220.2379990.8792220.0148881.0854440.0085550.724666为了便于对比,我们将上面的统计结果转化成柱状图的形式,图5.7是8个测试程取Pass前后LlCache失效率的对比图,图5.8是8个测试程序预取pass前后IPC的图。
【共引文献】
相关期刊论文 前8条
1 王正华;陆平静;车永刚;;迭代编译优化技术综述[J];计算机工程与应用;2008年32期
2 陆平静;车永刚;束尧;王正华;;多面体表示技术及在程序性能优化中的应用[J];计算机工程与科学;2008年09期
3 侯永生;赵荣彩;高伟;高伟;;非正规化循环的单指令多数据向量化[J];计算机应用;2013年11期
4 赵捷;赵荣彩;韩林;李宝亮;;面向MPI代码生成的Open64编译器后端[J];计算机学报;2014年07期
5 刘松;伍卫国;赵博;蒋庆;;面向局部性和并行优化的循环分块技术[J];计算机研究与发展;2015年05期
6 赵捷;赵荣彩;丁锐;黄品丰;;基于嵌套循环分类的并行识别技术[J];软件学报;2012年10期
7 侯永生;赵荣彩;高伟;李璇;;面向多面体模型的非规则程序SIMD投机优化技术[J];信息工程大学学报;2014年03期
8 邹燕燕;安虹;崔慧敏;周军蕊;;矩阵形状无关的并行编译优化[J];小型微型计算机系统;2014年07期
相关博士学位论文 前4条
1 严明;面向领域应用的异构多核SoC系统结构设计与优化[D];国防科学技术大学;2011年
2 陆平静;低开销的迭代编译优化关键技术研究[D];国防科学技术大学;2010年
3 姚远;SIMD自动向量识别及代码调优技术研究[D];解放军信息工程大学;2012年
4 王庆;面向嵌入式多核系统的并行程序优化技术研究[D];哈尔滨工业大学;2013年
相关硕士学位论文 前5条
1 张媛媛;自动向量化中的收益评估技术研究[D];解放军信息工程大学;2011年
2 赵捷;面向分布存储的并行编译优化技术研究[D];解放军信息工程大学;2012年
3 高伟;面向SIMD的自动向量化优化技术研究[D];解放军信息工程大学;2013年
4 邹燕燕;数据中心计算环境下基于语义模式的编译优化[D];中国科学技术大学;2014年
5 谢俊;基于TMS320C6678的细胞图像识别并行系统设计与实现[D];湘潭大学;2014年
本文编号:2726924
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2726924.html