当前位置:主页 > 科技论文 > 计算机论文 >

计算密集型应用在新型众核处理机环境下的实现及性能

发布时间:2017-06-12 04:03

  本文关键词:计算密集型应用在新型众核处理机环境下的实现及性能,由笔耕文化传播整理发布。


【摘要】:计算密集型应用一直是高性能计算(HPC)领域的一个重要话题。然而,计算密集型应用对硬件平台的计算能力要求甚高,使得传统的多处理器系统难以胜任。所幸,拥有大规模并行计算能力的新型众核处理机的问世改变了这一局面,为计算密集型应用注入了新的活力。当前,主流众核处理机的代表是NVIDIA的GPGPU和Intel的Xeon Phi,它们是超级计算机和计算机集群中广泛采用的加速器。最新的NVIDIA GPGPU采用Kepler架构,而Intel 最新推出的Xeon Phi基于MIC架构,它们都是并行计算领域的最新技术,却拥有截然不同的体系结构,代表着众核处理机的不同发展方向,因此计算密集型应用的实现平台有了不同的选择。在业内,对于这两者的比较还缺乏相对系统化的研究。本课题选取了一类典型的计算密集型应用——蒙特卡罗模拟,分别在两种众核处理机环境下实现并进行性能分析和比较。蒙特卡罗模拟的庞大计算量一直困扰它的应用和推广,其自身求解过程中包含的多次独立重复试验天生具有并行性,因此众核并行计算可以用来加速蒙特卡罗模拟,蒙特卡罗方法也成为了一个研究众核并行计算的完美切入点。本文的主要工作有:(1)探讨了并行计算的一些基本理论和编程模型。(2)深入研究了NVIDIA GPGPU和Intel Xeon Phi的体系结构与编程方法,并作了相应的对比和总结。(3)阐述了蒙特卡罗模拟的计算机实现及其在系统可靠性分析中的应用。(4)选取了两个蒙特卡罗模拟在系统可靠性分析中的具体案例,并在Tesla K20X GPU和Xeon Phi 5110P上实现,然后从多个角度对这两种加速器进行分析和比较。另外,为了更好地对两者的性能进行比较,本文还引入了相对计算能力的概念。最后,本文得出的结论是,对于蒙特卡罗模拟这一类计算密集型应用,NVIDIA的GPGPU在数据传输带宽、计算能力等方面优于Intel Xeon Phi。
【关键词】:GPGPU Phi协处理器 并行计算 蒙特卡罗
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP38
【目录】:
  • 摘要5-6
  • Abstract6-7
  • 第一章 绪论7-12
  • 1.1 研究背景7-10
  • 1.1.1 高性能计算7-8
  • 1.1.2 多核处理器的发展8-9
  • 1.1.3 众核处理机的出现9-10
  • 1.2 课题的研究内容10-11
  • 1.3 课题的研究目的11
  • 1.4 全文组织与安排11-12
  • 第二章 并行计算12-24
  • 2.1 并行体系结构12-13
  • 2.2 并行编程模型13-22
  • 2.2.1 隐式并行模型15
  • 2.2.2 数据并行模型15-17
  • 2.2.3 消息传递模型17-19
  • 2.2.4 共享存储模型19-21
  • 2.2.5 混合并行模型21-22
  • 2.3 并行编程面临的问题22-24
  • 第三章 众核处理机及其编程方法24-37
  • 3.1 NVIDIA的GPGPU及其编程技术24-30
  • 3.1.1 NVIDIA的Kepler架构24-26
  • 3.1.2 GPGPU的编程技术26-30
  • 3.2 Xeon Phi协处理器及其编程技术30-35
  • 3.2.1 Intel的MIC架构30-32
  • 3.2.2 MIC架构的编程技术32-35
  • 3.3 两种平台的异同35-37
  • 3.3.1 相同之处36
  • 3.3.2 不同之处36-37
  • 第四章 计算密集型应用举例37-45
  • 4.1 蒙特卡罗模拟37-40
  • 4.1.1 蒙特卡罗模拟概述37-38
  • 4.1.2 蒙特卡罗模拟的基本原理38
  • 4.1.3 蒙特卡罗模拟的基本过程38-39
  • 4.1.4 蒙特卡罗模拟的主要应用39-40
  • 4.2 系统可靠性分析40-45
  • 4.2.1 系统可靠性概述40-41
  • 4.2.2 系统可靠性分析指标41-42
  • 4.2.3 系统可靠性分析方法42-45
  • 第五章 计算密集型应用的实现与分析45-58
  • 5.1 应用案例的说明45-46
  • 5.1.1 应用案例一45-46
  • 5.1.2 应用案例二46
  • 5.2 实现方法46-47
  • 5.3 实现过程47-52
  • 5.3.1 随机数的计算机生成47-49
  • 5.3.2 概率特征的刻画49
  • 5.3.3 蒙特卡罗模拟单次抽样49-52
  • 5.4 实验结果与分析52-58
  • 5.4.1 实验结果53-54
  • 5.4.2 实验分析54-58
  • 第六章 总结与展望58-59
  • 6.1 总结58
  • 6.2 展望58-59
  • 参考文献59-61
  • 读硕士期间公开发表的论文61-62
  • 致谢62-63

【相似文献】

中国期刊全文数据库 前10条

1 傅丽丽;曾国荪;;N体问题的FPGA求解和设计方法[J];计算机科学;2010年11期

2 赵春宇,高劲松;计算密集型空间信息服务技术实现架构研究[J];地理空间信息;2004年05期

3 ;AlphaServer DS20强化64位计算[J];每周电脑报;1999年06期

4 朱敏;刘雷波;尹首一;杨晨;王文杰;魏少军;;H.264计算密集型任务在可重构处理器上的映射[J];电路与系统学报;2013年02期

5 杨志豪;赵太银;姚兴苗;李磊;;一种适应数据与计算密集型任务的私有云系统实现研究[J];计算机应用研究;2011年02期

6 郝永生;卢俊文;刘冠峰;温娜;;计算密集型与数据密集型混合网格作业调度算法[J];计算机工程与科学;2014年08期

7 车明康;;性能比8096强一倍的80C 196 16位单片机[J];微电子学与计算机;1988年12期

8 ;HP ProLiant扩展G8服务器[J];微电脑世界;2013年02期

9 高谷刚;时龙兴;杨军;;一种协同验证环境与协同设计方法[J];应用科学学报;2007年05期

10 ;专业应用[J];个人电脑;1997年08期

中国重要报纸全文数据库 前3条

1 ;计算场为PC带来力量[N];网络世界;2001年

2 赛迪评测计算机整机实验室;图形/计算密集型应用用户的选择[N];中国计算机报;2003年

3 ;踏平网格计算不平路[N];网络世界;2007年

中国硕士学位论文全文数据库 前2条

1 盛冲冲;计算密集型应用在新型众核处理机环境下的实现及性能[D];复旦大学;2014年

2 李双全;移动自组织云中任务卸载决策的研究[D];云南大学;2014年


  本文关键词:计算密集型应用在新型众核处理机环境下的实现及性能,由笔耕文化传播整理发布。



本文编号:443161

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/443161.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1a8f7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com