CPU/GPU异构集群并行计算模型研究
发布时间:2022-01-16 17:02
国民经济和科学技术的快速发展对高性能计算机的性能提出了更高的要求,采用通用CPU研制高性能计算机的传统方法,在能耗、散热、成本等方面遇到了重大的挑战。异构体系结构结合了通用处理器和加速处理器两者的优势,逐渐成为高性能计算机领域的主流体系结构。GPU以其强大的运算能力、高存储带宽、低功耗以及较好的可编程性,在异构计算机系统设计中确立了主导地位。在绿色高性能计算时代,CPU/GPU异构系统是一种非常有发展前景的并行计算机类型。大型CPU/GPU异构系统强大的计算能力为大规模科学和工程计算提供了很好的机遇,然而其复杂的硬件结构和独特的程序执行特点又给众多高性能计算研究人员提出了巨大的难题。作为并行计算的一个分支,并行计算模型是对底层并行计算机系统的抽象,其用少量参数反映并行计算机系统的资源和性能特征,是联系并行编程模型与底层并行计算机系统的纽带,对算法设计者意义重大。并行计算模型一般具有通用性,然而,对于新兴的CPU/GPU异构高性能计算系统,由于包含了三个层次的异构特点,现有相关模型已无法准确描述其结构特点和性能影响因素,因此迫切需要针对该类高性能计算系统开展并行计算模型研究,从而为当前以...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
TOP500超级计算机体系结构的发展趋势
像 边 缘 检 测、 图 形 去 噪 [ 13 ] 、以 及图 像匹 配 等都 能很 好 地移 高 的 加 速比 。 另 外 也有 研 究 者 对在 CU D A 提供 的 CU B L A 运 算 的 优 化 , 甚 至 有 些 研 究 者 提 出 了 关 于 CU D A 并 行 图 些应 用 的 实 现都 得 益 于 GP U 在高 性 能 计 算方 面 所 具有 的 优 , 2 ) 高 密 集的 运 算 ,3 ) 超 长图 形 流水 线。 G P U 与 CP U 的 电 路相 对 简单 , 而且 对 Ca c h e 的 需 求 较 小, 所 以大 部 分 晶电 路 和 多条 流 水 线 ,使 GP U 的计 算 速度 有 了 突 破性 的 飞 跃 运算 的 能力 。 学 计 算对 计 算的 要求 永 无止 境 ,从 图 1. 2[ 1] 可以 看 出, 科学 以 指数 级 增长 的 , 空气 动 力学 分 析, 激 光光 学 ,生 物 分子 能 力 达 到 1- 2 0 P et af l o ps , 对于 空 气动 力 学 设 计 , 计 算 宇 宙流 模 拟则 需 要 1- 10 0 E xa f l o p s 的计 算能 力 , 计 算化 学 领域 算 要 求 ,假 如 不能 很好 地 对一 些 应用 进 行并 行 优化 , 单 从由 CP U 平 台 完成 , 因此 GP U 在 这 些 高 计 算密 度 需求 领 域。
表 1. 2 20 1 2 年 TO P5 0 0 排名 前 五 位 超 级 计 算 机 的 内 核 数 从图 1. 3[ 1] 超级 计 算 机计 算 能 力可 以 看 出, 93 年初 第 一 期 T OP 50 0 中 ,当 的 超 级计 算 机是 5 9. 7G F L O P S ,而 0. 4 GF L O P S 则是 排 名最 后 一位 , 当 时 T O的 计 算能 力也 仅 是 1 . 17 T FL O P S , 0 5 年 T OP 5 00 中排 在 最后 一 位的 超级 计 比 这一 数 值要 高 。 到 了 20 12 年 6 月份 第 39 期的 T OP 50 0 中, 最 快的 超级 计 经 达 到了 1 6. 3 2P FL O P S ,而 T OP 50 0 总的 峰值 计 算能 力 已经 突 破 10 0P FL OP 12 3P FL OP S 。R AN K N AM E SP E C S C O U N T R Y C O R E S R m ax P fl o p/ 1 Se q u oi a IB M B lu e Ge n e/ Q P ow e r B Q C1 6 C 1 .6 GH zU SA 1 ,5 7 2 ,8 6 4 1 6 .3 32 K co m p u te r Fu ji t s u SP AR C 6 4 V II I f x 2 .0 GH z J ap a n 7 0 5 ,0 2 4 1 0 .5 1 03 M ir aIB M B lu eG e n e/ Q P ow e r B Q C1 6 C 1 .6 GH zU SA 7 8 6 ,4 3 2 8 .1 5 34 Su p er M U CIB M iD at aP le x D X 3 6 0 M 4 ,X eo nE 5 -2 6 8 0 8 C 2 .7 GH zG er m a n y 1 4 7 ,4 5 6 2 .8 9 75 T ia n h e -1 AN U D T Y H M P P , X eo n X 5 6 7 06 C 2 .9 3 GH z , N V ID IA 2 0 50 C h in a 1 8 6 ,3 6 8 2 .5 6 6
【参考文献】:
期刊论文
[1]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 杨学军,廖湘科,卢凯,胡庆丰,宋君强,苏金树. Journal of Computer Science & Technology. 2011(03)
[2]Dawning Nebulae:A PetaFLOPS Supercomputer with a Heterogeneous Structure[J]. 孙凝辉,邢晶,霍志刚,谭光明,熊劲,李波,马灿. Journal of Computer Science & Technology. 2011(03)
[3]并行计算模型对比分析[J]. 王欢,都志辉. 计算机科学. 2005(12)
[4]图形处理器用于通用计算的技术、现状及其挑战[J]. 吴恩华. 软件学报. 2004(10)
[5]一种实用的并行计算模型[J]. 计永昶,丁卫群,陈国良,安虹. 计算机学报. 2001(04)
博士论文
[1]面向CPU/GPU异构体系结构的并行计算关键技术研究[D]. 卢风顺.国防科学技术大学 2012
[2]面向CPU-GPU异构并行系统的编程模型与编译优化关键技术研究[D]. 唐滔.国防科学技术大学 2012
[3]并行计算可扩展性分析与优化[D]. 王之元.国防科学技术大学 2011
本文编号:3593080
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
TOP500超级计算机体系结构的发展趋势
像 边 缘 检 测、 图 形 去 噪 [ 13 ] 、以 及图 像匹 配 等都 能很 好 地移 高 的 加 速比 。 另 外 也有 研 究 者 对在 CU D A 提供 的 CU B L A 运 算 的 优 化 , 甚 至 有 些 研 究 者 提 出 了 关 于 CU D A 并 行 图 些应 用 的 实 现都 得 益 于 GP U 在高 性 能 计 算方 面 所 具有 的 优 , 2 ) 高 密 集的 运 算 ,3 ) 超 长图 形 流水 线。 G P U 与 CP U 的 电 路相 对 简单 , 而且 对 Ca c h e 的 需 求 较 小, 所 以大 部 分 晶电 路 和 多条 流 水 线 ,使 GP U 的计 算 速度 有 了 突 破性 的 飞 跃 运算 的 能力 。 学 计 算对 计 算的 要求 永 无止 境 ,从 图 1. 2[ 1] 可以 看 出, 科学 以 指数 级 增长 的 , 空气 动 力学 分 析, 激 光光 学 ,生 物 分子 能 力 达 到 1- 2 0 P et af l o ps , 对于 空 气动 力 学 设 计 , 计 算 宇 宙流 模 拟则 需 要 1- 10 0 E xa f l o p s 的计 算能 力 , 计 算化 学 领域 算 要 求 ,假 如 不能 很好 地 对一 些 应用 进 行并 行 优化 , 单 从由 CP U 平 台 完成 , 因此 GP U 在 这 些 高 计 算密 度 需求 领 域。
表 1. 2 20 1 2 年 TO P5 0 0 排名 前 五 位 超 级 计 算 机 的 内 核 数 从图 1. 3[ 1] 超级 计 算 机计 算 能 力可 以 看 出, 93 年初 第 一 期 T OP 50 0 中 ,当 的 超 级计 算 机是 5 9. 7G F L O P S ,而 0. 4 GF L O P S 则是 排 名最 后 一位 , 当 时 T O的 计 算能 力也 仅 是 1 . 17 T FL O P S , 0 5 年 T OP 5 00 中排 在 最后 一 位的 超级 计 比 这一 数 值要 高 。 到 了 20 12 年 6 月份 第 39 期的 T OP 50 0 中, 最 快的 超级 计 经 达 到了 1 6. 3 2P FL O P S ,而 T OP 50 0 总的 峰值 计 算能 力 已经 突 破 10 0P FL OP 12 3P FL OP S 。R AN K N AM E SP E C S C O U N T R Y C O R E S R m ax P fl o p/ 1 Se q u oi a IB M B lu e Ge n e/ Q P ow e r B Q C1 6 C 1 .6 GH zU SA 1 ,5 7 2 ,8 6 4 1 6 .3 32 K co m p u te r Fu ji t s u SP AR C 6 4 V II I f x 2 .0 GH z J ap a n 7 0 5 ,0 2 4 1 0 .5 1 03 M ir aIB M B lu eG e n e/ Q P ow e r B Q C1 6 C 1 .6 GH zU SA 7 8 6 ,4 3 2 8 .1 5 34 Su p er M U CIB M iD at aP le x D X 3 6 0 M 4 ,X eo nE 5 -2 6 8 0 8 C 2 .7 GH zG er m a n y 1 4 7 ,4 5 6 2 .8 9 75 T ia n h e -1 AN U D T Y H M P P , X eo n X 5 6 7 06 C 2 .9 3 GH z , N V ID IA 2 0 50 C h in a 1 8 6 ,3 6 8 2 .5 6 6
【参考文献】:
期刊论文
[1]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 杨学军,廖湘科,卢凯,胡庆丰,宋君强,苏金树. Journal of Computer Science & Technology. 2011(03)
[2]Dawning Nebulae:A PetaFLOPS Supercomputer with a Heterogeneous Structure[J]. 孙凝辉,邢晶,霍志刚,谭光明,熊劲,李波,马灿. Journal of Computer Science & Technology. 2011(03)
[3]并行计算模型对比分析[J]. 王欢,都志辉. 计算机科学. 2005(12)
[4]图形处理器用于通用计算的技术、现状及其挑战[J]. 吴恩华. 软件学报. 2004(10)
[5]一种实用的并行计算模型[J]. 计永昶,丁卫群,陈国良,安虹. 计算机学报. 2001(04)
博士论文
[1]面向CPU/GPU异构体系结构的并行计算关键技术研究[D]. 卢风顺.国防科学技术大学 2012
[2]面向CPU-GPU异构并行系统的编程模型与编译优化关键技术研究[D]. 唐滔.国防科学技术大学 2012
[3]并行计算可扩展性分析与优化[D]. 王之元.国防科学技术大学 2011
本文编号:3593080
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3593080.html