计算密集型应用在新型众核处理机环境下的实现及性能

发布时间：2017-06-12 04:03

本文关键词：计算密集型应用在新型众核处理机环境下的实现及性能，由笔耕文化传播整理发布。

【摘要】：计算密集型应用一直是高性能计算(HPC)领域的一个重要话题。然而,计算密集型应用对硬件平台的计算能力要求甚高,使得传统的多处理器系统难以胜任。所幸,拥有大规模并行计算能力的新型众核处理机的问世改变了这一局面,为计算密集型应用注入了新的活力。当前,主流众核处理机的代表是NVIDIA的GPGPU和Intel的Xeon Phi,它们是超级计算机和计算机集群中广泛采用的加速器。最新的NVIDIA GPGPU采用Kepler架构,而Intel 最新推出的Xeon Phi基于MIC架构,它们都是并行计算领域的最新技术,却拥有截然不同的体系结构,代表着众核处理机的不同发展方向,因此计算密集型应用的实现平台有了不同的选择。在业内,对于这两者的比较还缺乏相对系统化的研究。本课题选取了一类典型的计算密集型应用——蒙特卡罗模拟,分别在两种众核处理机环境下实现并进行性能分析和比较。蒙特卡罗模拟的庞大计算量一直困扰它的应用和推广,其自身求解过程中包含的多次独立重复试验天生具有并行性,因此众核并行计算可以用来加速蒙特卡罗模拟,蒙特卡罗方法也成为了一个研究众核并行计算的完美切入点。本文的主要工作有：(1)探讨了并行计算的一些基本理论和编程模型。(2)深入研究了NVIDIA GPGPU和Intel Xeon Phi的体系结构与编程方法,并作了相应的对比和总结。(3)阐述了蒙特卡罗模拟的计算机实现及其在系统可靠性分析中的应用。(4)选取了两个蒙特卡罗模拟在系统可靠性分析中的具体案例,并在Tesla K20X GPU和Xeon Phi 5110P上实现,然后从多个角度对这两种加速器进行分析和比较。另外,为了更好地对两者的性能进行比较,本文还引入了相对计算能力的概念。最后,本文得出的结论是,对于蒙特卡罗模拟这一类计算密集型应用,NVIDIA的GPGPU在数据传输带宽、计算能力等方面优于Intel Xeon Phi。
【关键词】：GPGPU Phi协处理器 并行计算 蒙特卡罗
【学位授予单位】：复旦大学
【学位级别】：硕士
【学位授予年份】：2014
【分类号】：TP38
【目录】：

摘要5-6
Abstract6-7
第一章绪论7-12
1.1 研究背景7-10
1.1.1 高性能计算7-8
1.1.2 多核处理器的发展8-9
1.1.3 众核处理机的出现9-10
1.2 课题的研究内容10-11
1.3 课题的研究目的11
1.4 全文组织与安排11-12
第二章并行计算12-24
2.1 并行体系结构12-13
2.2 并行编程模型13-22
2.2.1 隐式并行模型15
2.2.2 数据并行模型15-17
2.2.3 消息传递模型17-19
2.2.4 共享存储模型19-21
2.2.5 混合并行模型21-22
2.3 并行编程面临的问题22-24
第三章众核处理机及其编程方法24-37
3.1 NVIDIA的GPGPU及其编程技术24-30
3.1.1 NVIDIA的Kepler架构24-26
3.1.2 GPGPU的编程技术26-30
3.2 Xeon Phi协处理器及其编程技术30-35
3.2.1 Intel的MIC架构30-32
3.2.2 MIC架构的编程技术32-35
3.3 两种平台的异同35-37
3.3.1 相同之处36
3.3.2 不同之处36-37
第四章计算密集型应用举例37-45
4.1 蒙特卡罗模拟37-40
4.1.1 蒙特卡罗模拟概述37-38
4.1.2 蒙特卡罗模拟的基本原理38
4.1.3 蒙特卡罗模拟的基本过程38-39
4.1.4 蒙特卡罗模拟的主要应用39-40
4.2 系统可靠性分析40-45
4.2.1 系统可靠性概述40-41
4.2.2 系统可靠性分析指标41-42
4.2.3 系统可靠性分析方法42-45
第五章计算密集型应用的实现与分析45-58
5.1 应用案例的说明45-46
5.1.1 应用案例一45-46
5.1.2 应用案例二46
5.2 实现方法46-47
5.3 实现过程47-52
5.3.1 随机数的计算机生成47-49
5.3.2 概率特征的刻画49
5.3.3 蒙特卡罗模拟单次抽样49-52
5.4 实验结果与分析52-58
5.4.1 实验结果53-54
5.4.2 实验分析54-58
第六章总结与展望58-59
6.1 总结58
6.2 展望58-59
参考文献59-61
读硕士期间公开发表的论文61-62
致谢62-63

【相似文献】

中国期刊全文数据库前10条

1 傅丽丽;曾国荪;;N体问题的FPGA求解和设计方法[J];计算机科学;2010年11期

2 赵春宇,高劲松;计算密集型空间信息服务技术实现架构研究[J];地理空间信息;2004年05期

3 ;AlphaServer DS20强化64位计算[J];每周电脑报;1999年06期

4 朱敏;刘雷波;尹首一;杨晨;王文杰;魏少军;;H.264计算密集型任务在可重构处理器上的映射[J];电路与系统学报;2013年02期

5 杨志豪;赵太银;姚兴苗;李磊;;一种适应数据与计算密集型任务的私有云系统实现研究[J];计算机应用研究;2011年02期

6 郝永生;卢俊文;刘冠峰;温娜;;计算密集型与数据密集型混合网格作业调度算法[J];计算机工程与科学;2014年08期

7 车明康;;性能比8096强一倍的80C 196 16位单片机[J];微电子学与计算机;1988年12期

8 ;HP ProLiant扩展G8服务器[J];微电脑世界;2013年02期

9 高谷刚;时龙兴;杨军;;一种协同验证环境与协同设计方法[J];应用科学学报;2007年05期

10 ;专业应用[J];个人电脑;1997年08期

中国重要报纸全文数据库前3条

1 ;计算场为PC带来力量[N];网络世界;2001年

2 赛迪评测计算机整机实验室;图形/计算密集型应用用户的选择[N];中国计算机报;2003年

3 ;踏平网格计算不平路[N];网络世界;2007年

中国硕士学位论文全文数据库前2条

1 盛冲冲;计算密集型应用在新型众核处理机环境下的实现及性能[D];复旦大学;2014年

2 李双全;移动自组织云中任务卸载决策的研究[D];云南大学;2014年

本文关键词：计算密集型应用在新型众核处理机环境下的实现及性能，由笔耕文化传播整理发布。

，

本文编号：443161

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/443161.html

上一篇：基于Redis的信息存储优化技术研究与应用
下一篇：物联网时代微控制器的服务转型

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|