当前位置:主页 > 科技论文 > 计算机论文 >

基于粒子模拟问题的GPU高性能计算系统

发布时间:2020-12-10 11:32
  计算科学同理论和物理实验并列已成为科学研究的第三支柱。由于它对计算的需求是无穷无尽的,因此高性能计算成为计算科学中非常关键的推动力量。提高计算速度的方法一般采用更快的处理器等硬件设备或者采用更优化的程序设计方法和函数库。近年来,CPU一直按照摩尔定律所预测的速度发展,但是采用提高CPU制程和主频的来提高CPU的计算能力的传统办法遇到工艺上的壁垒,暂时无法突破。另一方面,采用上述方法所导致的功耗与发热量过大,也制约了CPU的快速发展。GPU原本是一种处理图形任务的处理器。由于它的特殊架构,使其非常适合于高效率低成本的高性能并行数值计算,因此最近几年得到快速的发展,也逐渐成为高性能计算一个重要分支。分子动力学与宇宙学作为计算科学两个重要的应用领域,通常需要解决复杂的科学计算与数据处理问题。粒子模拟问题是这两个应用领域经常遇到的计算模拟问题,然而目前采用基于CPU的高性能计算技术不能满足上述领域快速地解决粒子计算模拟问题的要求,从而大大制约了科学研究的进程。因此,本文就这一粒子模拟问题所遇到的计算瓶颈,提出了一套基于GPU高性能计算的解决方案。本文将首先设计搭建基于GPU的高性能计算硬件平台... 

【文章来源】:复旦大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:54 页

【学位级别】:硕士

【部分图文】:

基于粒子模拟问题的GPU高性能计算系统


Top500总计算能力、排名第一、排名第500的系统图

原理图,场效应管,原理图,电子


如图2.1所示,比如45nm,就是该制造工艺下可以实现的最小GATE长度为45nm。GATE加上高电压的时候,它的下方会为SourCe和Drain两极架起一座电子桥,仿佛按下了一个开关,这样S/D两极就可以导通。电子穿过S/D用的时间越短,一个MOS管的动作就越快,整个芯片就会越快。想要缩短电子穿过S/D的时间,只有缩短距离,即GATE的长度。所以为了保证芯片取得相应制程下的最快的速度

工作流程图,计算系统,工作流程图,服务器


GPU计算系统不是说不需要CPU而直接采用GPU来搭建系作用在整个计算系统中弱化了,由本来所担任计算的关键角色制GPU计算设备的角色。用户向CPU服务器递交所要计算的服务器来分配计算任务给所控制的GPU计算设备,GPU计算回到CPU服务器上,最终返回给用户。CPU服务器在计算的算的数据读入服务器内存,然后通过PCI一E接口数据交换到存中,GPU计算时,在其显存中读取数据来进行计算。所搭建的GPU高性能计算系统分为两种,主要是针对不同的应单任务的计算系统,主要是针对计算任务不多的使用者所提出计算系统成本比较低。如图3.2(a)所示,搭建时采用一块Tesl集成在CPU服务器的主板上。第二种是多任务的计算系统,多的使用者,但是相对于单任务系统的成本提高不少。主要采用1070设备外接集成到CPU服务器上。

【参考文献】:
期刊论文
[1]图形处理器用于通用计算的技术、现状及其挑战[J]. 吴恩华.  软件学报. 2004(10)



本文编号:2908622

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2908622.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dde01***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com