基于数据对象规模的Rank级内存分配方法
本文关键词:基于数据对象规模的Rank级内存分配方法 出处:《计算机研究与发展》2014年03期 论文类型:期刊论文
更多相关文章: 访存冲突 操作系统 rank聚簇 内存分配 数据对象
【摘要】:利用主存的多bank/rank/channel结构挖掘访存并行性和局部性,是提高系统性能的重要手段.相关研究工作通过sub-rank技术增加可并行工作的存储资源,或在并行程序之间对bank划分,以隔离访存冲突.但上述方法没有考虑在bank/rank资源共存的情况下,单个程序内部数据对象间的冲突问题.通过观察数据在主存中的分布,发现程序的数据倾向聚簇于单个rank中,并提出了一种基于数据对象规模的rank级内存分配方法(data object scale aware rank-level memory allocation,DSRA).DSRA将冲突开销较大的数据对象分散到不同的rank,利用增长的bank/rank资源提高访存性能.DSRA工作在操作系统层,基于编译器和操作系统提供的信息来分析数据对象间的冲突开销,既不用修改源码,也不依赖特殊的底层硬件.基于2款真实处理器对来自NAS Benchmark和SPEC CPU2000中的存储敏感型基准测试程序进行评测.结果表明,在不影响cache失效率的情况下,DSRA通过减少主存访问周期数,可以降低程序的执行时间.与已有的优化技术相比,性能平均提高6.8%,最高性能提升幅度为16%.
[Abstract]:It is an important means to improve the performance of the system by using the multi bank / rank / channel structure of the main memory . The related research work increases the storage resources which can work in parallel or partition the bank between the parallel programs to isolate the memory conflict . However , the method does not consider the problem of conflict between the data objects in the single program under the condition of coexistence of bank / rank resources . DSRA is used to disperse data objects with large collision cost to different rank , and use the raised bank / rank resources to improve the memory performance . The DSRA works on the operating system layer . Based on the information provided by the compiler and the operating system , the conflict cost between the data objects is analyzed . The results show that the DSRA can reduce the execution time of the program without affecting the cache miss efficiency . Compared with the existing optimization technology , the performance of the DSRA can be improved by 6.8 % , and the maximum performance improvement amplitude is 16 % .
【作者单位】: 北京大学微处理器研究开发中心;首都师范大学高可靠嵌入式系统技术北京市工程技术研究中心;
【基金】:“核高基”国家科技重大专项基金项目(2009ZX01029-001-002)
【分类号】:TP333.1
【正文快照】: 处理器和主存之间存在较大的性能差距.cache利用局部性减少处理器访问主存的次数,但片上集成cache的容量有限,并且单一的替换策略也难以满足程序访存行为的多样性[1].对于存储敏感型应用,处理器会耗费大量时间用于访问主存,因此需要主存更加快速响应处理器的访存请求.当前主存
【共引文献】
相关期刊论文 前10条
1 党向磊;王箫音;佟冬;陆俊林;易江芳;王克义;;一种基于值预测和指令复用的按序处理器预执行机制[J];电子学报;2011年12期
2 张吉豫;刘先华;谭明星;程旭;丛京生;;一种针对位操作密集应用的扩展指令自动选择方法[J];电子学报;2012年02期
3 黄涛;王晶;王克义;;一种降低末级高速缓存污染的分阶段自适应动态插入策略[J];北京大学学报(自然科学版);2014年02期
4 张轶;关楠;王义;;一种多核系统上基于页着色的内存管理方法[J];东北大学学报(自然科学版);2014年03期
5 党向磊;王箫音;佟冬;陆俊林;程旭;王克义;;面向按序执行处理器的预执行指导的数据预取方法[J];电子学报;2012年11期
6 孟建超;;一种并行化算法在Coq中的实现及其正确性描述[J];电子技术;2015年09期
7 胡伟武;高燕萍;陈天石;肖俊华;;The Godson Processors:Its Research,Development,and Contributions[J];Journal of Computer Science & Technology;2011年03期
8 吕方;崔慧敏;王蕾;刘磊;武成岗;冯晓兵;游本中;;Dynamic I/O-Aware Scheduling for Batch-Mode Applications on Chip Multiprocessor Systems of Cluster Platforms[J];Journal of Computer Science & Technology;2014年01期
9 黄涛;王晶;管雪涛;钟祺;王克义;;采用分区域管理的软硬件协作高能效末级高速缓存设计[J];计算机辅助设计与图形学学报;2013年11期
10 钟祺;王晶;王克义;;面向多媒体SoC的存储体访存负载均衡划分方法[J];计算机辅助设计与图形学学报;2015年03期
相关会议论文 前1条
1 张亮;刘杰;韩文燕;高剑刚;;计算机多媒体加速技术研究[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
相关博士学位论文 前2条
1 王荣华;动态二进制翻译优化研究[D];浙江大学;2013年
2 陈全;面向复杂并行架构的高性能低功耗任务调度的研究[D];上海交通大学;2014年
相关硕士学位论文 前8条
1 彭毓佳;多核网络处理器共享存储控制系统设计与优化[D];西安电子科技大学;2012年
2 张晓芳;基于网格的用户身份管理系统研究[D];华北电力大学;2012年
3 余丹萍;基于程序阶段行为的共享缓存动态划分方法研究[D];华中科技大学;2013年
4 袁大星;虚拟化环境下面向分布式非关系型数据管理的通信优化系统[D];华中科技大学;2013年
5 郭雪蓉;基于重用距离分析的多虚拟机缓存划分系统[D];华中科技大学;2013年
6 刘春雷;基于国产处理器计算机系统回卷恢复机制的研究[D];哈尔滨工业大学;2014年
7 刘诗源;多核操作系统中基于页着色的内存管理技术的研究[D];东北大学;2011年
8 赵全营;面向云计算的用户数据安全策略研究[D];大连理工大学;2014年
【相似文献】
相关期刊论文 前10条
1 赵素萍;控制C++的内存分配[J];长春师范学院学报;2005年09期
2 钱晓明;小块内存分配器设计与实现[J];电脑编程技巧与维护;2005年02期
3 王明路;王希敏;王哲;;嵌入式系统中池式内存分配方法的分析[J];计算机与数字工程;2008年02期
4 靳广斌,曹焕林;内存的利用和优化以及系统的典型配置[J];电力学报;1995年03期
5 谢晓恒,李卫华;利用扩充内存实现多幅图象的快速存储[J];计算机应用研究;1997年02期
6 邹本振;;面向对象语言三大机制的内存分配研究[J];电脑知识与技术;2009年19期
7 李智毅;内存驻留程序的管理[J];计算机应用;1992年04期
8 卢浩;IMGDRIVE.EXE的进一步改进[J];微电脑世界;1996年07期
9 邹永贵;C~(++)中类与内存分配[J];重庆邮电学院学报;1999年03期
10 金永涛;白焰;;内存情况一目了然[J];电脑爱好者;1994年03期
相关重要报纸文章 前4条
1 上海 高博;奔向64位[N];电脑报;2004年
2 上海 夏翔;改善SQL Server内存管理[N];电脑报;2004年
3 小新;专科门诊Photoshop专科[N];中国电脑教育报;2003年
4 ;AdobePhotoshop常见问题之专家会诊[N];江苏经济报;2003年
相关硕士学位论文 前4条
1 陈静怡;云环境下基于内存共享的服务器整合算法研究[D];复旦大学;2012年
2 韩志刚;一个内存分配器的设计和实现[D];东北大学;2008年
3 陈春环;基于异构双核双路视频数据处理平台的设计与研究[D];北京邮电大学;2015年
4 陈宝罗;数字相框设计与实现[D];西南交通大学;2009年
,本文编号:1393869
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1393869.html