当前位置:主页 > 科技论文 > 计算机论文 >

片上多处理器体系结构中Cache一致性模型研究

发布时间:2019-08-12 14:14
【摘要】:现代的片上多处理器大都采用共享存储结构,每个处理器核都拥有自己的私有缓存,这就需要高速缓存一致性模型来管理共享数据。早期的缓存一致性模型多用于板级多处理器系统中,对于片上多处理器结构而言,实现缓存一致性模型的技术参数及约束条件都发生了变化,从而带来了许多新的研究问题。由其是通过扩展高速缓存一致性模型实现硬件事务存储和推测多线程机制,为大幅度降低共享存储并行编程的复杂性带来了新的机遇。因此,围绕着高速缓存一致性模型的功能扩展、性能优化以及提高可扩展性等方面的工作仍然是工业界和学术界共同关注的热点研究问题。 本文主要从高速缓存一致性模型的功能扩展和性能优化两个方面开展研究工作,通过发掘高速缓存一致性模型在功能及性能两方面的潜在优势,来达到对多核处理器芯片上晶体管资源的充分利用,并在保证片上多处理器模型扩展性的基础上,提升整个系统的性能,以适应未来多核及众核体系结构对高速缓存一致性模型的需要。本文研究工作的主要内容和成果如下。 本文工作的第一部分是研究高速缓存一致性协议功能扩展模型。通过扩展高速缓存一致性协议的功能,实现对硬件事务存储机制及推测多线程机制混合模型的高效支持。硬件事务存储机制及推测多线程机制都可以采用高速缓存一致性模型的功能扩展来实现,且二者对硬件的需求类似,因此可以提供对二者的统一硬件支持。但是针对单个芯片中有限的硬件资源及功耗的限制,及应用程序对自身性能日益增长的需求,如何能实现一个高效的功能扩展模型,仍是一个重要的问题。针对此问题,本文在事务存储及推测多线程两种机制的统一高效硬件支持方面展开了深入的研究,其主要研究成果包括:(1)提出了一个新的基于高速缓存一致性模型的功能扩展模型TT-Dir,此扩展模型可以同时支持事务存储及推测多线程两种机制;(2)为TT-Dir模型引入了快速回退机制,在保证原始事务及推测线程提交速度的前提下,实现了对粒度较小的事务及推测线程的快速回退;(3)为TT-Dir模型引入了冲突容忍机制,实现了对并发推测线程之间写后读及写后写型二义性冲突的容忍,减少了并发推测线程间的冲突数量;并针对事务存储模型引入了动态定序机制,使上述冲突容忍机制也能适用于事务存储模型中。对模型的评测结果表明,TT-Dir模型可以在满足较小硬件需求及功耗的基础上,有效提升上述两种机制自身的性能。 本文工作的第二部分是研究高速缓存一致性协议优化模型,包括性能优化和可扩展性优化两个方面。现代应用程序对性能及吞吐率的需求越来越高,因此需要片上高速缓存一致性模型不断提升其性能,以满足上层应用的需求;且随着片上处理器核数越来越多,片上高速缓存一致性模型需要提供良好的扩展性,以满足未来多核及众核体系结构发展的需要;此外,单个芯片上有限的硬件资源及功耗约束又为高速缓存一致性模型的扩展性引入了新的难点。为了对高速缓存一致性模型的性能及扩展性影响因素进行详细的分析,本文首先将高速缓存一致性模型的实现分为网络层及行为层两个方面,并从这两个方面分别进行了深入研究,主要研究成果包括:(1)在网络层方面,本文首先对片上网络中影响高速缓存一致性模型性能的因素进行了分析,根据分析结果提出了基于阶段优先级的一致性模型PPB, PPB模型引入了“阶段性”消息的概念,使不同阶段的消息具有不同的优先级;随后本文还给出了此PPB模型的具体实现机制,这其中包括一致性消息优先级的设置及相应片上网络中的仲裁机制;(2)在行为层方面,本文针对目录一致性模型的性能及硬件需求两个方面进行了优化,提出了一个基于本地目录机制的高速缓存一致性模型Loc-Dir。首先,此Loc-Dir模型采用了本地目录模型来降低一致性模型实现的硬件需求,即保证了一致性模型的扩展性;其次Loc-Dir模型引入了预测机制来降低目录一致性模型中的间接数据传输延迟,在预测器的实现中,本文提出了基于通信模式的预测器来扩展可预测地址的范围;最后,本文还提出了针对应用程序中通信模式的优化策略,并提出了对本地私有缓存的替换策略的修改方案,以使其适应上述Loc-Dir的预测机制。 本文的研究工作获得了如下一些重要的认识:(1)片上高速缓存一致性模型可以高效地应用于并行编程模型,以简化并行编程模型对共享数据的管理;(2)片上网络与高速缓存一致性模型之间相互依赖且相互制约,一致性模型产生的一致性消息直接影响了片上网络的负载量,而一致性消息在片上网络中的传输也影响了一致性模型自身的性能,所以,建立起一致性模型与片上网络的接口,以实现对二者的协同管理,是提升整个系统性能的关键;(3)对于目录一致性模型来讲,多级目录机制是降低目录开销的重要策略;而针对应用程序中的数据共享模式或者通信模式进行优化,也是目录一致性模型获得性能提升的一个重要方法。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP333

【相似文献】

中国期刊全文数据库 前10条

1 李健航,潘孝梅;Pentium体系结构简介[J];微型机与应用;1994年10期

2 戴梅萼,史嘉权;计算机系统存储体设计技术的探讨[J];微型机与应用;1995年03期

3 周军;病毒能藏在CMOS和CACHE中吗?[J];电脑爱好者;1998年12期

4 尚毅,向旭光;怎样使奔腾586奔起来[J];实验技术与管理;1996年02期

5 周,

本文编号:2525767


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2525767.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户96fef***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com