当前位置:主页 > 科技论文 > 计算机论文 >

适用于多/众核系统的智能目录高速缓存

发布时间:2021-11-23 03:47
  集成电路技术的进步使得多个处理器核能够集成到单个芯片上,处理器核间的同步和通信成为提高多/众核系统性能的关键因素。共享存储模型是片上多处理器研究和应用中的一个热点问题,涉及到片上高速缓存资源的利用和一致性协议的实现。处理器核数的持续增长使得基于侦听的一致性协议面临性能和带宽的瓶颈。基于目录的一致性协议凭借其较好的可扩展性被广泛地采用,但面临硬件成本问题。目录高速缓存总的存储是目录条目尺寸和目录条目数量的乘积,其开销随着处理器核数的增加而迅速增长。本文针对共享存储片上多处理器系统,通过挖掘和利用数据访存模式,设计了表现力强、硬件开销小、灵活高效的片上存储子系统。表现力是指在目录高速缓存中跟踪和记录了数据的访存模式。本文主要解决了三个问题:1)目录条目尺寸的压缩,2)目录条目数量的压缩,3)分布式高速缓存和目录高速缓存的协调利用。首先,本文提出了一种混合结构的目录来减少目录条目的平均尺寸。传统目录缓存为每个条目分配了一个全向量来跟踪可能的共享者,其尺寸随着处理器核数成线性增长。本文从一个全新的、整体的角度来挖掘目录高速缓存的规律,根据其跟踪数据在访存模式上的差异性,提出了采用不同类型的条目... 

【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校

【文章页数】:126 页

【学位级别】:博士

【部分图文】:

适用于多/众核系统的智能目录高速缓存


图3.1分布式共享目录缓存系统

多粒度,目录


图3.18多粒度目录和一致性免除技术的对比如图3.18所示,区域一致性免除技术的IPC在64-set (降低1.3%)之后随条目数量的减少呈现下降趋势;私有/共享多粒度目录的趋势和区域一致性免除技术比较接近;而自适应多粒度目录一直到12-set (降低1.5%)之后才出现下降趋势。总的来看,在约1/10的基准目录下,区域一致性免除技术和私有/共享多粒度目录的丨PC相比基准块管理目录分别降低了 7.4%, 6.1%和4.7%,而自适应多粒度目录增加了 0.1%。相比固定的区域条目设定,自适应机制提高了多粒度目录的管理能力。而和区域一致性免除技术相比,自适应多粒度目录在同等资源下性能提高了 7.5%;在同样的性能下,自适应多粒度目录的目录资源比区域一致性免除技术要少5.3倍(64-set和12-set)。当然两种机制相结合(RCD+AMG)会获得更好的效果。我们也进行了 64路多处理器下的仿真,结果表明自适应多粒度目录仍然可以将目录条目数量减少一个数量级

访问模式,元数据,策略,数据


享者可以预测附近的其他共享者,或者通过地址轮转来查找分霧保存者。所以宿主节点主要是为新加入共享者提供保存者的位置信息。图4.1显示了不同访问模式的数据/元数据委托策略。整个系统包含16个节点,分成4个分族,上部的图例中给出了图中英文缩写的含义。私有 读写 只读 。… HMC:宿主元数据缓存,home metadata cachef B H:H_ K: Keepers: Sharer cMC:—致性元数据缓存,coherence metadata cacheCore DLl j CMC Core DLl CMC Core DLl CMC Core DLI CMCI I 11 I 1 11 I r I I I 11 I 1 I i 11 II LIC I iHMcl I LZC IHMCI I LLC | |HMC| I LIC I IHMCIiiimii OSRouter Router Router Router(0,0) c (0,1) ¢=============4 (0.2) g (0,3)* A-* ICore DLl | |CMC| Core DLl i |CMC| Core DLl | | CMC | Core | DLl | | CMC |■ c" ? {/" "vI LLC I IhmcI | LLC IHMCI | ux | IHMCI | LLC | IHMCI圖 ■ 汲I LsL I Lsl Iv. ., I Jy.Router Router | Router Router(1,0) ■;:.:,:.::.:::0 (1,1) riiifTII. III. {1, 2) ; {1,Core DLl CMC Core DLl CMC Core DLl CMC Core DLl CMC□國画 11 II □國國 同陶I LLC I IhmcI | llc IhmcI | llc | |hmcI | llc | IhmcI网□ __I 网 u __[' '"^1 I交I I!' " \ ■ "''^1 r娜,."i,Router Router Router [ | Router(2,0) ;J丨丨丨丨—.-丨■"丨 I. 丨,(2,1) !丨丨丨釋■十(2,2) 』-■丨』___■$ ‘ ^(^^3)Core DLl CMC Core DLl CMC | Core DLI CMC Core DLl CMCr 11 II I 同_I LLC I IhmcI | uZ | |hivic| | llc | IhmcI [ llc | IhmcI

【参考文献】:
期刊论文
[1]片上多核处理器末级共享Cache可重用数据预测机制[J]. 韩立敏,高德远,樊晓桠,史莉雯,安建峰.  吉林大学学报(工学版). 2012(06)
[2]众核处理器cache一致性研究综述[J]. 韩立敏,安建峰,高德远,樊晓桠,任向隆.  计算机应用研究. 2012(11)
[3]片上多核处理器共享末级缓存动静结合地址映射机制[J]. 曹非,刘志勇.  计算机科学. 2012(08)
[4]片上多处理器共享Cache的访存时间最优划分方法[J]. 李浩,谢伦国.  通信学报. 2012(04)
[5]片上多处理器末级Cache优化技术研究[J]. 李浩,谢伦国.  计算机研究与发展. 2012(S1)
[6]基于分布式合作cache的私有cache划分方法[J]. 李浩,谢伦国.  计算机应用研究. 2012(01)
[7]一种基于数据访问特征的层次化缓存优化设计[J]. 李崇民,王海霞,张熙,汪东升.  计算机学报. 2011(11)
[8]片上多核Cache资源管理机制研究[J]. 贾小敏,张民选,齐树波,赵天磊.  计算机科学. 2011(01)
[9]CMP中基于目录的协作Cache设计方案[J]. 赵小雨,吴俊敏,隋秀峰,王庆波,唐轶轩.  计算机工程. 2010(21)
[10]Hierarchical Cache Directory for CMP[J]. 郭松柳,王海霞,薛一波,李崇民,汪东升.  Journal of Computer Science & Technology. 2010(02)

博士论文
[1]片上多处理器关键技术研究[D]. 顾雄礼.浙江大学 2011
[2]片上互连网络跨层交互的应用层优化框架[D]. 王小航.浙江大学 2011

硕士论文
[1]面向多核系统的程序并行化方法[D]. 黄春明.浙江大学 2012



本文编号:3513062

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3513062.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户67bdf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com