SCMP中共享多端口数据Cache结构的研究
发布时间:2020-05-16 14:26
【摘要】: 在巨大规模芯片时代来临的时候,体系结构的研究又遇到了新的课题:如何有效利用数目众多的晶体管?如何去设计与巨大规模芯片相适应的微处理器体系结构?当前的处理器主流技术超标量结构由于实现非常复杂和资源利用率低的缺陷而难以再大幅度提高其性能。因此,随着半导体工艺技术的飞速发展,在一块芯片上集成多个相对简单的处理器的单芯片多处理器(SCMP)结构将是一条提高处理器性能的有效途径。 为此,在分析SCMP结构特点的基础上,本文提出了单芯片多处理器的共享Cache结构:共享多端口数据Cache结构(SMPDCA)。 SMPDCA结构具有六个突出优势:相对于大规模的超标量结构而言,SMPDCA结构的控制逻辑复杂性明显要低得多;相对于通过共享主存来实现处理器之间的通信的结构而言,通过一个共享的第一级数据Cache来实现处理器之间的通信的SMPDCA结构能够提供非常小的处理器之间的通信延迟;没有Cache一致性维护开销;数据Cache命中率提高;便于SMP(对称多处理器结构)的软件重用;从多个层次上开发程序的并行性。 本文给出了SMPDCA的结构模型,说明了SMPDCA结构的各个功能单元,讨论了SMPDCA结构的一些关键技术,分析阐述了利用交叉存储Cache来实现多端口Cache的三种地址映像策略。 本文利用模拟器RSIM对SMPDCA结构进行了详细的性能模拟分析,从数据Cache命中率、通信开销、共享数据Cache的访问延迟对性能的影响以及程序执行时间四个方面给出了模拟结果,并对模拟结果进行了分析。性能模拟结果表明,由于多个处理器都集成在一块芯片上,采用多个处理器共享Cache的结构将能够更加有效地发挥SCMP结构的性能优势。特别是对于处理器之间的通信与交互比较多的应用程序,其性能的提高更加明显。 针对SMPDCA结构所存在的硬件实现代价的问题,为了证明其可行性,本文以一个面积为300mm~2左右的芯片的设计为目标,通过性能模拟比较,,我们得出结论:在一块芯片上集成多个相对简单的微处理器是完全可行的,在硬件实现代价相近的情况下,SMPDCA结构可以获得比Superscalar结构更优的性能。 针对SMPDCA结构中所存在的共享数据Cache的带宽问题,本文在分析影响带宽的因素的基础上探讨了多种提高共享数据Cache带宽的方法。并分别对更多的访问端口、非阻塞Cache以及快速命中缓冲区(QHB)等三种方法进行了详细描述和性能模拟分析。 总的来说,SMPDCA结构是一种值得进一步深入研究的处理器体系结构。
【图文】:
国防科学技术大学研究生院学位论文超标量处理器实现的复杂度限制了超标量技术随VLsl很难依靠继续增大超标量处理器的规模(如发射宽度、能。构资源利用率低测试,超标量处理器中资源利用率非常低,只有20%,
图5.9FF’I’应用程序PCA结构的通信开销占程序执行时间的百分SMPDCA结构的通信开销占程序执行时间的5.10所示。nUCU八ltC甘n
本文编号:2666871
【图文】:
国防科学技术大学研究生院学位论文超标量处理器实现的复杂度限制了超标量技术随VLsl很难依靠继续增大超标量处理器的规模(如发射宽度、能。构资源利用率低测试,超标量处理器中资源利用率非常低,只有20%,
图5.9FF’I’应用程序PCA结构的通信开销占程序执行时间的百分SMPDCA结构的通信开销占程序执行时间的5.10所示。nUCU八ltC甘n
本文编号:2666871
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2666871.html