当前位置:主页 > 科技论文 > 计算机论文 >

“神威·太湖之光”上某流体力学应用的任务图并行化研究

发布时间:2025-03-29 23:26
  近几年来,众核处理器的不断发展,对并行编程模型在并行编程简单化、高并行效率方面提出了高的要求,成为了高性能计算领域的研究热点。“神威·太湖之光”是我国自主研发的高性能众核平台,申威众核处理器支持加速线程库和OpenACC并行编程模型。其中,加速线程库采用修饰符(Modifier)的方式来对局部数据存储器(Local Data Memory,LDM)空间中的常量或者变量进行定义,用户直接对线程和LDM空间进行分配和管理,编程层次较低。申威并行编程模型OpenACC以编译制导的方式实现应用程序并行化,并提供对中间代码的二次开发解决方案,解决仅靠编译制导方式存在的计算性能局限问题,但申威OpenACC并未发掘不同任务之间的LDM数据重用。AceMesh任务调度系统在多核众核平台实现针对网格应用的并行调度。通过API接口的方式自动发掘结构化网格应用中存在的数据驱动任务图的并行性,并提供多种手段发掘任务图执行中的数据局部性,克服多核、众核平台带来的编程挑战。本文基于“神威·太湖之光”的申威众核处理器,在对某流体力学应用的OpenACC并行版本分析研究的基础上,实现该流体力学应用的任务图并行优化,并...

【文章页数】:62 页

【学位级别】:硕士

【部分图文】:

图2.1申威众核处理器两级并行模式??Fig.2.1The?Two-level?Parallel?Mode?of?Sunway?Many-core?Processor??

图2.1申威众核处理器两级并行模式??Fig.2.1The?Two-level?Parallel?Mode?of?Sunway?Many-core?Processor??

MPI并行,位置空间继续挖掘更细粒度的并行,在位置空间采用任务图并行,??实现“基于消息传递编程模型的MPI进程级并行+基于任务图调度并行的众核线??程级并行”的两级并行方式。如图2.1所示,两级并行模式能充分挖掘在“神威?太??湖之光”系统上的并行计算能力。??2D数组??'?....


图2.2申威众核处理器结构图??Fig.2.2The?Architecture?of?Sunway?Many-core?Processor??

图2.2申威众核处理器结构图??Fig.2.2The?Architecture?of?Sunway?Many-core?Processor??

2.?2.1?“神威?太湖之光”结构??“祌威太湖之光”整机使用了?40960个采用异构架构的我国自主研发的??“中国芯”[48?51]——申威众核处理器。申威众核处理器结构如图2.2、2.3所示。??每个申威众核处理器主要由4个异构群组成,每个异构群均采用主从核结??构,其中两....


图2.4申威26010存储模型示意图??Fig.2.4?SW26010?Storage?Model?Diagram??

图2.4申威26010存储模型示意图??Fig.2.4?SW26010?Storage?Model?Diagram??

片上融合异构众核体系结构,device可直接访问主存空间,并在device内提供??加速线程私有的高速缓冲(LDM,Local?Data?Memory),加速计算需要存放到LDM??的数据由device控制传输。本系统支持的存储模型如图2.4所示。??「??????????主搬6....


图2.5?AceMesh任务调度系统的结构图??

图2.5?AceMesh任务调度系统的结构图??

图2.5?AceMesh任务调度系统的结构图??Fig.2.5?General?process?of?collaborative?filtering??图2.5是AceMesh任务调度系统的结构图。本调度系统包括四层:??最上层提供对外的接口,包括任务粒度的描述、数据流信息、任务....



本文编号:4037819

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/4037819.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户52029***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com