基于多线程应用特性的多/众核系统片上互连与缓存一致性整体优化方法
发布时间:2021-08-12 15:54
当高性能处理器集成核数达到16-64个核及以上时,其本质上已是一个TFlops的高性能并行计算机系统。芯片除了单独工作,又有连成更大的计算机系统的需求。一般在互连通信研究上重视处理器间的连接,但实际系统设计中其突出的问题是如何协同处理多核互连和运行时存储一致性。处理器核的连接需要协同分布式共享存储器的访问。在访问存储器时,保证多核存储层次的一致性和效率占用了互连通信相当多的软硬件资源,增加了运行中的延迟开销,降低了并行计算的效率和系统的可扩展性。因此必须要把数据传输和存储层次统一考虑,合理地处理好高速缓存的一致性。本文多角度分析应用程序数据相关特性,明确多/众核系统的性能瓶颈和优化方向,对存储子系统和互连子系统整体优化,提高数据存储、维护和通信的效率,降低硬件、时延和能耗开销,提高系统效能。首先,本文对具有代表性的多线程应用程序进行实验分析,跟踪统计多个维度的各项性能参数,包括工作集大小、数据共享特性、数据局部性、数据线程亲缘性、片上通信量、一致性维护等。通过分析各项性能参数,应用统计学方法分析特定性能参数的分布规律,理解各应用程序对存储资源的需求、一致性维护的需求、通信需求,剖析不同...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:146 页
【学位级别】:博士
【部分图文】:
图1.1典型片上多核系统示意图??从片外存储器取得的数据依照某种算法确定存储在哪个节点的共享缓存中
表修改(Modified,简写为M)、独占(Exclusive,简写为巧、共享巧hared,简写为??S)和无效(Invalid,简写为1)4种一致性状态。数据的毎一份私有拷贝中化记录着??这些状态。目录中的一致性状怒转换如图1.3。数据第一次被访问时从无效态转??入独占态,任何时候如果被修改都进入修改态。数据在独占或修改态下只存在一??个私有拷贝,从而可!^乂在本地进行修改,不存在与其它私有数据拷贝不一致的问??题。两种状态的区别在于独占态数据是干净的,被替换之后不需要将数据写回到??外存。如果有其它核访问独占或修改态的数据,访问者被加入共享者列表,同时??数据进入共享态。此时需要通知原本唯一的拥有者数据状态发生了转变,避免该??共享者在本地直接修改数据,造成不同私有数据拷贝不一致。共享患的数据被读??取时无需再通知其它共享者
2.2.研究内容??研究针对的片上多核系统如图2.1所示。该片上多核结构包含多个节点,毎??个包含一个或多个核、私有高速缓存、最后一级高速缓存、W及片上互连接口等。??片上多核系统通常需要较大的片上存储空间W保证足够的内存访问带宽。般来??说最后一级高速缓存采用地址轮转的方式存波数据,于是发生本地私有缓冲缺失??时高速缓存控制器会发出数据请求消息到该数据的宿主节点最后一级高速緩存??获取数据。这种地址轮转的映射方式实现简单,是常用的做法,可L乂保证数据均??衡分布。在片上多核系统运行多线程程序时,要将并行执行的线程分配到不同的??核上运行。一般来说,操作系统会采用简单的顺序映射方式分配线程,即0?n??号线程分别顺序分配到0?n号核。当某个核上运行的线程需要使用存储在其它节??点的数据时,就需要进行通信。????——^?刊。Tile?1^^^^?Tile?1^^^^?Tile??11—I?[?1?i\i?0?n?^?n?I?n??i?CPU?d,rectory?|?玄韦王??I?I??i??.?Tile?L?Jl\\e?、?Tile??i?4?5?6?7??I円可?口?I圧去t去??j?*?'??i?!?Tile?Tile?L?l?Tile?、?Tile??i??___j|i?Y?n?三。^門。??I?swhxh?1/?X?X?I?X??I?I?h!?T1lel_^K?刊?e?Tile??L?—?—一;?U?13?14?15??图2.1化路片上多核系统框图??本章主要分析不同应用程序数据相关的特征
【参考文献】:
期刊论文
[1]多核处理器目录缓存结构设计[J]. 王恩东,唐士斌,陈继承,王洪伟,倪璠,赵雅倩. 计算机研究与发展. 2015(06)
[2]2014年中国高性能计算机发展现状分析与展望[J]. 张云泉. 科研信息化技术与应用. 2015(01)
[3]数据密集型科学与工程:需求和挑战[J]. 宫学庆,金澈清,王晓玲,张蓉,周傲英. 计算机学报. 2012(08)
[4]多核处理器的关键技术及其发展趋势[J]. 黄国睿,张平,魏广博. 计算机工程与设计. 2009(10)
[5]多核处理器及其对系统结构设计的影响[J]. 谢向辉,胡苏太,李宏亮. 高性能计算技术. 2007 (04)
博士论文
[1]片上多处理器关键技术研究[D]. 顾雄礼.浙江大学 2011
本文编号:3338614
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:146 页
【学位级别】:博士
【部分图文】:
图1.1典型片上多核系统示意图??从片外存储器取得的数据依照某种算法确定存储在哪个节点的共享缓存中
表修改(Modified,简写为M)、独占(Exclusive,简写为巧、共享巧hared,简写为??S)和无效(Invalid,简写为1)4种一致性状态。数据的毎一份私有拷贝中化记录着??这些状态。目录中的一致性状怒转换如图1.3。数据第一次被访问时从无效态转??入独占态,任何时候如果被修改都进入修改态。数据在独占或修改态下只存在一??个私有拷贝,从而可!^乂在本地进行修改,不存在与其它私有数据拷贝不一致的问??题。两种状态的区别在于独占态数据是干净的,被替换之后不需要将数据写回到??外存。如果有其它核访问独占或修改态的数据,访问者被加入共享者列表,同时??数据进入共享态。此时需要通知原本唯一的拥有者数据状态发生了转变,避免该??共享者在本地直接修改数据,造成不同私有数据拷贝不一致。共享患的数据被读??取时无需再通知其它共享者
2.2.研究内容??研究针对的片上多核系统如图2.1所示。该片上多核结构包含多个节点,毎??个包含一个或多个核、私有高速缓存、最后一级高速缓存、W及片上互连接口等。??片上多核系统通常需要较大的片上存储空间W保证足够的内存访问带宽。般来??说最后一级高速缓存采用地址轮转的方式存波数据,于是发生本地私有缓冲缺失??时高速缓存控制器会发出数据请求消息到该数据的宿主节点最后一级高速緩存??获取数据。这种地址轮转的映射方式实现简单,是常用的做法,可L乂保证数据均??衡分布。在片上多核系统运行多线程程序时,要将并行执行的线程分配到不同的??核上运行。一般来说,操作系统会采用简单的顺序映射方式分配线程,即0?n??号线程分别顺序分配到0?n号核。当某个核上运行的线程需要使用存储在其它节??点的数据时,就需要进行通信。????——^?刊。Tile?1^^^^?Tile?1^^^^?Tile??11—I?[?1?i\i?0?n?^?n?I?n??i?CPU?d,rectory?|?玄韦王??I?I??i??.?Tile?L?Jl\\e?、?Tile??i?4?5?6?7??I円可?口?I圧去t去??j?*?'??i?!?Tile?Tile?L?l?Tile?、?Tile??i??___j|i?Y?n?三。^門。??I?swhxh?1/?X?X?I?X??I?I?h!?T1lel_^K?刊?e?Tile??L?—?—一;?U?13?14?15??图2.1化路片上多核系统框图??本章主要分析不同应用程序数据相关的特征
【参考文献】:
期刊论文
[1]多核处理器目录缓存结构设计[J]. 王恩东,唐士斌,陈继承,王洪伟,倪璠,赵雅倩. 计算机研究与发展. 2015(06)
[2]2014年中国高性能计算机发展现状分析与展望[J]. 张云泉. 科研信息化技术与应用. 2015(01)
[3]数据密集型科学与工程:需求和挑战[J]. 宫学庆,金澈清,王晓玲,张蓉,周傲英. 计算机学报. 2012(08)
[4]多核处理器的关键技术及其发展趋势[J]. 黄国睿,张平,魏广博. 计算机工程与设计. 2009(10)
[5]多核处理器及其对系统结构设计的影响[J]. 谢向辉,胡苏太,李宏亮. 高性能计算技术. 2007 (04)
博士论文
[1]片上多处理器关键技术研究[D]. 顾雄礼.浙江大学 2011
本文编号:3338614
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3338614.html