片上内存控制器性能评估和优化
发布时间:2021-03-21 08:41
存储系统的性能是影响现代计算机系统性能的重要因素之一。近二十年来,芯片结构以及制造工艺的不断改进使得处理器和内存的工作效率都得到了相应的提高。但是,从现在的发展趋势来看,内存工作频率提高的速度远远低于处理器主频提高的速度,这使得处理器的访存性能越来越成为制约系统性能的瓶颈。 工业界和学术界一直致力于缩小处理器和存储器之间的差距,提高处理器的访存效率。最近5年来在硬件方面主要出现了下面三种相关技术,这些技术的出现为存储系统的优化带来了新的机会和问题。 ● DDRⅠ/Ⅱ等新型内存设备(DDRⅠ/Ⅱ SDRAM) ● 片内集成内存控制器(On-chip Memory Controller) ● 多核多线程架构(MultiCore and MultiThreading) 结合龙芯2号处理器的结构特点,本文系统的讨论了上述新的硬件技术对内存控制器设计的影响。本文的贡献主要分成评估和优化两个方面: ◆ 基于程序周期行为的性能评估方法 准确快速的性能评估环境和方法是进行各种性能优化的前提,考虑到硬件结构设计的特殊性,软件模拟器正逐渐成为性能评估的重要手段。本...
【文章来源】:中国科学院大学(中国科学院计算技术研究所)北京市
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
BBEdge不11SimPoint模拟的加速比除了模拟速度,另一个重要的衡量标准是相对误差
则访存延时只是读命令到数据传输的延时,相对aoespage策略来说,省去了行激活所带来的延时。所以,对于访存行为局部性好的应用程序来说,O沐nPage策略在访存效率上要优于Cloespage策略。相反,对于访存行为空间局部性差的应用程序来说,aoespgae策略在访存效率上要优于openpage策略。这样,使用固定的。拌nPgae或CloesPage管理策略的内存控制电路的访存效率极大地依赖于应用程序的访存地址空间局部性好坏,而应用程序的访存行为是不固定的,因此,在不考虑其他优化策略的影响下,仅仅使用固定的Page管理策略性能不会太好。但是,如果使用访存调度的技术,情况就会有所不同。内存控制器可以主动的从访存队列中选择需要访问当前己经打开的Page的访存请求优先发给内存芯片。这样,即使在b出止管理策略上使用单一的0详nPage,也可能会得到比较好的效果。这种访存调度效果的好坏依赖于在任一时刻,调度器能否从访存队列中选出满足openPgae要求的访存请求,即尽可能的让连续的访存请求命中同一个Pgae。由于应用程序本身的访存特征很大程度上决定了上述选择的空间,所以我们先对龙芯指令集下PSEC2000测试程序的访存模式进行分析,考察对于邻近的若干访存请求,是否可以选出至少一个访存请求,使其满足openPgae模式。
.41.3实验数据和性能分析为了得到相对准确的存储系统的行为,这里使用的是经过验证的S加05一Gdeosn全系统模拟器,使用默认的参数,在模拟方法上用BBEdge算法来缩短模拟的时间。图.47选出了表.42中的5个组合,A[gebaesd+AdaptivePgae],[MostPendnig+Adaptivep理:]e,四ostPending+LoealOPtimal],[FewestPending+A山PItivePagel,任ewestPending+L以习】御均mal』和不使用调度策略的O拌nPgae田aeslniel,其他组合的数据因为篇幅的问题在这里就不列出来了。
本文编号:3092567
【文章来源】:中国科学院大学(中国科学院计算技术研究所)北京市
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
BBEdge不11SimPoint模拟的加速比除了模拟速度,另一个重要的衡量标准是相对误差
则访存延时只是读命令到数据传输的延时,相对aoespage策略来说,省去了行激活所带来的延时。所以,对于访存行为局部性好的应用程序来说,O沐nPage策略在访存效率上要优于Cloespage策略。相反,对于访存行为空间局部性差的应用程序来说,aoespgae策略在访存效率上要优于openpage策略。这样,使用固定的。拌nPgae或CloesPage管理策略的内存控制电路的访存效率极大地依赖于应用程序的访存地址空间局部性好坏,而应用程序的访存行为是不固定的,因此,在不考虑其他优化策略的影响下,仅仅使用固定的Page管理策略性能不会太好。但是,如果使用访存调度的技术,情况就会有所不同。内存控制器可以主动的从访存队列中选择需要访问当前己经打开的Page的访存请求优先发给内存芯片。这样,即使在b出止管理策略上使用单一的0详nPage,也可能会得到比较好的效果。这种访存调度效果的好坏依赖于在任一时刻,调度器能否从访存队列中选出满足openPgae要求的访存请求,即尽可能的让连续的访存请求命中同一个Pgae。由于应用程序本身的访存特征很大程度上决定了上述选择的空间,所以我们先对龙芯指令集下PSEC2000测试程序的访存模式进行分析,考察对于邻近的若干访存请求,是否可以选出至少一个访存请求,使其满足openPgae模式。
.41.3实验数据和性能分析为了得到相对准确的存储系统的行为,这里使用的是经过验证的S加05一Gdeosn全系统模拟器,使用默认的参数,在模拟方法上用BBEdge算法来缩短模拟的时间。图.47选出了表.42中的5个组合,A[gebaesd+AdaptivePgae],[MostPendnig+Adaptivep理:]e,四ostPending+LoealOPtimal],[FewestPending+A山PItivePagel,任ewestPending+L以习】御均mal』和不使用调度策略的O拌nPgae田aeslniel,其他组合的数据因为篇幅的问题在这里就不列出来了。
本文编号:3092567
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3092567.html