多核数字信号处理系统中高速缓存配置与布局研究
本文关键词: 高速缓存 高速缓存配置 多级高速缓存架构 分布式共享高速缓存 多核一致性协议 数据预取 出处:《南京大学》2017年硕士论文 论文类型:学位论文
【摘要】:处理器与存储器性能之间的剪刀差现象和多核发展的趋势,使存储墙问题越来越严重,高速的存储体系成为高性能计算的保证。多核环境下的片上存储高速缓存对提高存储体系性能至关重要。针对多核数字信号处理系统研究高速缓存架构的优化方法,本文基于CACTI和GEM5仿真平台,采用系统仿真方法,对高速缓存进行了详细探索和研究。本文具体研究了高速缓存内部配置、多级高速缓存组织架构和数据预取技术,提出了高速缓存配置和多级高速缓存组织架构优化的方向。(1)一级高速缓存宜配置为2路组相关,二级高速缓存宜配置为8路组相关,缓存块长度配置为32或64字节为佳。(2)二级高速缓存对一级高速缓存容量比较小情况下,独占型包含关系缓存的性能较好,容量比大于8之后包含性关系对性能影响不再显著。(3)对于需要大量数据共享和交互的应用,具有一定分布性的全局共享二级高速缓存相较于簇内共享二级高速缓存能够提供更好的性能。(4)改进的MOESI 一致性协议相对比MESI 一致性协议对系统性能没有显著的提升,根据简单可靠原则,优先考虑采用MESI 一致性协议。(5)相对跨步预取,硬件预取功能的实现宜采用顺序预取机制。
[Abstract]:The problem of memory wall becomes more and more serious because of the scissors difference between processor and memory performance and the trend of multi-core development. High-speed storage system becomes the guarantee of high performance computing. On-chip storage cache in multi-core environment is very important to improve the performance of storage system. Research on the optimization of cache architecture for multi-core digital signal processing system. Law. Based on the simulation platform of CACTI and GEM5, this paper uses system simulation method to explore and study cache in detail. This paper studies the internal configuration of cache in detail. Multi-level cache organization architecture and data prefetching technology. The direction of cache configuration and multi-level cache organizational architecture optimization is proposed. The secondary cache should be configured as 8-channel group correlation, and the buffer block length should be 32 or 64 bytes. Exclusive inclusion relationship caching has better performance, and the impact of inclusion relationships on performance is no longer significant when the capacity ratio is greater than 8) for applications that require a large amount of data sharing and interaction. Global shared secondary cache with certain distribution can provide better performance than shared two-level cache in cluster. The improved MOESI conformance protocol has no significant improvement on system performance compared with MESI conformance protocol. According to the principle of simple and reliable, MESI Conformance Protocol. 5) relative step prefetching is preferred, and the sequential prefetching mechanism should be used to realize the hardware prefetching function.
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP332
【相似文献】
相关期刊论文 前10条
1 金华;;高速缓存助你远走高飞[J];电脑采购周刊;2004年16期
2 崔昌栋;鞠大鹏;李兆麟;;采用路选择技术实现的低功耗高速缓存设计[J];清华大学学报(自然科学版);2007年01期
3 陈黎明;邹雪城;雷擰铭;刘政林;;动态可重构高速缓存结构的研究与设计[J];微电子学;2007年06期
4 黄涛;王晶;管雪涛;钟祺;王克义;;一种降低末级高速缓存污染的软件控制插入策略[J];电子学报;2012年12期
5 孙丕恕,辛卫华;高速缓存386系统的实现[J];小型微型计算机系统;1989年09期
6 徐景村,何培斌;微机高速缓存系统组织与数据更新探讨[J];山东师大学报(自然科学版);1998年01期
7 周全营;计算机存储系统的高速缓存[J];郑州纺织工学院学报;1999年S1期
8 吴英杰,王晓东;理想高速缓存模型及其高效算法研究[J];福州大学学报(自然科学版);2004年04期
9 胡泽林;张云泉;;高速缓存优化的并行连接算法[J];计算机工程与设计;2009年20期
10 刘娟;共享外部超高速缓存的双处理机块的设计和实施[J];航空计算技术;1998年01期
相关会议论文 前1条
1 高欣;刘衡竹;张波涛;;高速缓存优化研究与设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年
相关重要报纸文章 前10条
1 飞思卡尔半导体公司汽车和标准产品部Johann Holzmann;利用高速缓存体系结构进行汽车引擎嵌入式控制[N];中国电子报;2005年
2 杨阿昭;ECDN 提高网络性能[N];中国计算机报;2002年
3 宋占川;Oracle服务器性能调整攻略[N];计算机世界;2003年
4 高明云;高速缓存技术实现更快内容传输[N];人民邮电;2003年
5 山枫;趋势科技利用高速缓存方案 企业防毒性能长5倍[N];中国计算机报;2002年
6 陈怡均 DigiTimes;IBM研发新DRAM电路[N];电子资讯时报;2007年
7 本报记者 武汉;来跟着我的节拍[N];网络世界;2003年
8 小溪综合编译;新一代视频游戏机上演三国大战[N];计算机世界;2006年
9 ;显卡术语释义[N];电脑报;2002年
10 山东财政学院 杨晓红;为电子商务站点加速[N];计算机世界;2000年
相关博士学位论文 前2条
1 方磊;适用于多/众核系统的智能目录高速缓存[D];浙江大学;2014年
2 隋秀峰;高性能微处理器中自适应高速缓存管理策略研究[D];中国科学技术大学;2010年
相关硕士学位论文 前10条
1 孙传伟;CPU-GPU融合架构上共享Cache的动态划分技术[D];中国科学技术大学;2015年
2 段广山;片上高速缓存可靠性研究[D];南京大学;2014年
3 孙越;5G网络中高速缓存存储器的配置方案[D];南昌大学;2016年
4 王明乾;一种基于STT-RAM的高速缓存设计[D];国防科学技术大学;2014年
5 汪伟斌;多核数字信号处理系统中高速缓存配置与布局研究[D];南京大学;2017年
6 冷冰;基于路访问轨迹和路休眠的高速缓存低功耗研究[D];浙江大学;2012年
7 吴英杰;充分利用高速缓存的高效算法研究[D];福州大学;2004年
8 梁静;基于路预测访问的低功耗高速缓存设计研究[D];浙江大学;2012年
9 赵彩;基于混合纠错码的可容错性高速缓存研究[D];浙江大学;2015年
10 陈石坤;多核处理器中CACHE一致性协议研究和实现[D];国防科学技术大学;2005年
,本文编号:1483745
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1483745.html