面向共享存储系统的计算模型及性能优化
发布时间:2021-07-06 13:00
长期以来,大规模计算的应用需求推动并行计算技术不断发展,并行计算机的峰值计算能力稳步提高。当前,基于共享存储的片上多核处理器搭建集群系统,成为并行体系结构的发展趋势,并行计算已经进入了千万亿次并行计算机的时代。但是,并行计算机的实际应用水平不高,应用程序实测性能远低于系统的峰值性能。因此,充分发挥并行计算机的计算能力,加速应用程序的执行速度,逐渐成为并行计算领域中亟需解决的一个关键问题。未来,共享存储系统是搭建大规模并行处理系统的基本单元。围绕提高并行计算机的实际应用效率,缩小实际应用性能与机器峰值性能之间的差异,本文以共享存储系统为目标平台,研究并行计算模型以及程序性能优化关键技术,主要研究工作分为两部分:一是研究分层的并行计算模型,为并行算法设计和并行程序执行提供理论基础和分析方法,其中重点研究片上多核系统的程序执行模型;二是研究共享存储系统上的程序性能优化技术,以提高并行应用程序的实际性能,同时为程序执行模型提供思路和借鉴。本文针对计算模型和优化技术的研究,可以有效地提高并行应用的性能,充分发挥并行计算机的计算能力,具有重要的学术价值和广泛的应用前景。具体而言,本文的主要研究成果...
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:133 页
【学位级别】:博士
【部分图文】:
BSP模型中超级步的计算过程示意图
共享内存系统的ch一shmem。出于兼容性、通用如不同机器可以使用的共享内存大小不同,M没有针对共享存储做深入优化,导致MPI通信高。ch_shmem实现中,每个进程有一个独立消息,队列的大小为当前通信域中进程的个数进程之间的消息传递通过读写该通信队列来访问该共享队列的不同部分,即多个进程可列所有者发送消息),只有一个进程可以读共发送者之间使用锁来实现对共享队列的互斥读制数据到共享队列的尾部,然后消息接收者从地址空间。通常需要锁来保证对系统共享缓程同时向共享队列追加数据或者接收进程在读消息,保证对共享队列写的时候没有其他销比较大。
上一节讨论的MPI消息传递实现中,两次的数据复制是不必要的,如果消息发送者需要保存发送的数据仅一次的数据复制就可以了,甚至某些情况下不需要数据复制,如图3.2所示。当进程间有数据要传递时,预先使用进程间同步机制申请一块共享内存,需要传递的数据直接存放在这块内存中,其他进程都可以访问该共享内存块,可以读取其中的数据或者复制到自己的地址空间中。当所有的进程共享同一个数据结构,不同进程写该数据结构的不同部分,计算时会用到其他进程之前写入的数据,这时不需要进行数据复制,在一个进程写43
【参考文献】:
期刊论文
[1]并行计算的一体化研究现状与发展趋势[J]. 陈国良,孙广中,徐云,龙柏. 科学通报. 2009(08)
[2]并行算法研究方法学[J]. 陈国良,孙广中,徐云,吕敏. 计算机学报. 2008(09)
[3]并行计算系列课程教学团队建设[J]. 孙广中,徐云,郑启龙,吴俊敏,陈国良. 计算机教育. 2008(15)
[4]分层并行计算模型[J]. 陈国良,苗乾坤,孙广中,徐云,郑启龙. 中国科学技术大学学报. 2008(07)
[5]基于龙芯2F的国产万亿次高性能计算机KD-50-I的研制[J]. 张俊霞,张焕杰,李会民. 中国科学技术大学学报. 2008(01)
[6]RNA二级结构预测中动态规划的优化和有效并行[J]. 谭光明,冯圣中,孙凝晖. 软件学报. 2006(07)
[7]万亿次机群系统高性能应用软件运行现状分析[J]. 侯晓吻,张林波,张云泉. 计算机工程. 2005(22)
[8]面向高性能数值计算的并行计算模型DRAM(h)[J]. 张云泉. 计算机学报. 2003(12)
[9]并行计算性能的“双流”分析[J]. 乔香珍. 计算机科学. 2001(10)
[10]一种实用的并行计算模型[J]. 计永昶,丁卫群,陈国良,安虹. 计算机学报. 2001(04)
博士论文
[1]基于SMP结点的机群通信系统关键技术的研究[D]. 马捷.中国科学院研究生院(计算技术研究所) 2001
硕士论文
[1]NHBL并行计算模型的扩展及其性能验证[D]. 许入文.北京交通大学 2008
[2]一种改进的NHBL并行计算模型及其性能评测[D]. 赵琛.北京交通大学 2007
本文编号:3268289
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:133 页
【学位级别】:博士
【部分图文】:
BSP模型中超级步的计算过程示意图
共享内存系统的ch一shmem。出于兼容性、通用如不同机器可以使用的共享内存大小不同,M没有针对共享存储做深入优化,导致MPI通信高。ch_shmem实现中,每个进程有一个独立消息,队列的大小为当前通信域中进程的个数进程之间的消息传递通过读写该通信队列来访问该共享队列的不同部分,即多个进程可列所有者发送消息),只有一个进程可以读共发送者之间使用锁来实现对共享队列的互斥读制数据到共享队列的尾部,然后消息接收者从地址空间。通常需要锁来保证对系统共享缓程同时向共享队列追加数据或者接收进程在读消息,保证对共享队列写的时候没有其他销比较大。
上一节讨论的MPI消息传递实现中,两次的数据复制是不必要的,如果消息发送者需要保存发送的数据仅一次的数据复制就可以了,甚至某些情况下不需要数据复制,如图3.2所示。当进程间有数据要传递时,预先使用进程间同步机制申请一块共享内存,需要传递的数据直接存放在这块内存中,其他进程都可以访问该共享内存块,可以读取其中的数据或者复制到自己的地址空间中。当所有的进程共享同一个数据结构,不同进程写该数据结构的不同部分,计算时会用到其他进程之前写入的数据,这时不需要进行数据复制,在一个进程写43
【参考文献】:
期刊论文
[1]并行计算的一体化研究现状与发展趋势[J]. 陈国良,孙广中,徐云,龙柏. 科学通报. 2009(08)
[2]并行算法研究方法学[J]. 陈国良,孙广中,徐云,吕敏. 计算机学报. 2008(09)
[3]并行计算系列课程教学团队建设[J]. 孙广中,徐云,郑启龙,吴俊敏,陈国良. 计算机教育. 2008(15)
[4]分层并行计算模型[J]. 陈国良,苗乾坤,孙广中,徐云,郑启龙. 中国科学技术大学学报. 2008(07)
[5]基于龙芯2F的国产万亿次高性能计算机KD-50-I的研制[J]. 张俊霞,张焕杰,李会民. 中国科学技术大学学报. 2008(01)
[6]RNA二级结构预测中动态规划的优化和有效并行[J]. 谭光明,冯圣中,孙凝晖. 软件学报. 2006(07)
[7]万亿次机群系统高性能应用软件运行现状分析[J]. 侯晓吻,张林波,张云泉. 计算机工程. 2005(22)
[8]面向高性能数值计算的并行计算模型DRAM(h)[J]. 张云泉. 计算机学报. 2003(12)
[9]并行计算性能的“双流”分析[J]. 乔香珍. 计算机科学. 2001(10)
[10]一种实用的并行计算模型[J]. 计永昶,丁卫群,陈国良,安虹. 计算机学报. 2001(04)
博士论文
[1]基于SMP结点的机群通信系统关键技术的研究[D]. 马捷.中国科学院研究生院(计算技术研究所) 2001
硕士论文
[1]NHBL并行计算模型的扩展及其性能验证[D]. 许入文.北京交通大学 2008
[2]一种改进的NHBL并行计算模型及其性能评测[D]. 赵琛.北京交通大学 2007
本文编号:3268289
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3268289.html