MIC-CPU对等模式下程序优化研究
本文关键词:MIC-CPU对等模式下程序优化研究
【摘要】:近年来,超级计算机不断发展,已成为信息时代下各国科技实力的一个重要体现。然而受限于晶体管物理极限以及当前制造工艺水平的限制,CPU的性能发展已经减缓且逐渐无法满足人们的追求。这种情况下,要达到更强的计算性能,一个可行的方法是不断的增加计算集群的规模。然而,计算规模的增大必然导致整个系统功耗的线性增长。因此从2007年开始,人们开始使用GPGPU进行高密度的浮点计算,协助CPU进行高速运算,这种由不同类型运算部件构成的系统也称之为异构计算系统。INTEL作为最强的处理器提供厂商,在2012年发布了先进的众核加速器MIC,迄今为止已经得到了较为广泛的应用。MIC与CPU采用同样的x86指令集,MIC内部运行一个我们称之为μOS的精简的Linux系统。因此MIC与CPU的编程模式十分相似,MIC计算核心可以作为独立的计算节点参与计算,与CPU在逻辑上地位相对等。这种MIC应用模式我们称之为对等模式,对等模式下运行在CPU和MIC核心上的进程之间通过消息传递接口(Message-Passing Interface,MPI)进行消息传递。与运行在传统只由CPU构成的计算系统上的MPI程序类似,MPI通信也会造成不小的程序运行开销。本文以MIC-CPU对等模式为研究对象,考察程序在对等模式下执行时的通信开销,并进行与其相关的优化研究。主要取得了以下成果:1.对等模式下,运算部件包括CPU和MIC,MIC通过PCI-e接口连接到CPU构成计算节点,集群中各个计算节点通过高速网络进行互连。而两个相互通信的进程间可能在整个集群中的任何两个运算部件上,通信时通路的不同带来通信的复杂性。本文对MIC-CPU对等模式通信与应用的性能展开测试与分析,包括节点内和节点间CPU+MIC及MIC+MIC等不同组合时运算部件间的通信性能。并测试了对等模式下通信性能对Linpack和NPB执行性能的影响;2.对等模式下程序的实质是MPI程序,而针对MPI程序的优化策略包括本地优化和全局优化。本文首先针对mini MD程序进行MIC本地优化,包括SIMD优化和线程扩展优化。然后根据MIC和CPU的运算能力进行负载平衡,使得在对等模式下运行时不会由于负载不均衡导致性能损失;3.根据对等模式下不同计算单元间通信性能的差异和不同进程间通信需求的差异,研究进程重排(进程和计算单元的映射)对程序性能的影响,寻找最优进程分配方案,以期获得更好的性能。具体来说,本文将进程与计算单元间的映射关系抽象为二次分配问题(QAP),采用蚁群遗传算法进行优化排布;
【关键词】:对等模式 通信测试 负载平衡 进程重排
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP332
【目录】:
- 摘要9-11
- ABSTRACT11-14
- 第一章 绪论14-22
- 1.1 课题背景14-18
- 1.2 研究现状18-20
- 1.2.1 MIC应用现状18-19
- 1.2.2 对等模式相关优化概述19-20
- 1.3 本文研究内容和创新20
- 1.4 论文结构20-22
- 第二章 背景知识22-36
- 2.1 MIC系统结构特点和编程模型22-29
- 2.1.1 MIC系统结构特点22-25
- 2.1.2 MIC通用编程模型25-29
- 2.2 MIC优化方法概述29-35
- 2.2.1 并行度优化31
- 2.2.2 内存管理优化31
- 2.2.3 数据传输优化31-32
- 2.2.4 存储器访问优化32-33
- 2.2.5 向量化优化33-34
- 2.2.6 负载均衡优化34
- 2.2.7 线程扩展性优化34-35
- 2.3 对等模式下全局优化策略35-36
- 第三章 对等模式平台搭建与通信测试36-48
- 3.1 平台搭建36-39
- 3.1.1 硬件环境搭建36-37
- 3.1.2 软件环境搭建37-39
- 3.2 对等模式下通信性能测试39-48
- 3.2.1 测试方法39-40
- 3.2.2 测试结果40-48
- 第四章 MIC本地优化及负载平衡48-56
- 4.1 miniMD算法分析48-49
- 4.2 miniMD本地向量化49-53
- 4.2.1 短程势能向量化优化50-52
- 4.2.2 邻居列表更新向量化优化52-53
- 4.3 miniMD线程扩展与负载均衡优化53-56
- 第五章 进程重排程序优化56-67
- 5.1 问题建模56-58
- 5.2 蚁群算法58-60
- 5.3 实现过程及结果60-67
- 5.3.1 工具程序60-62
- 5.3.2 测试过程及结果62-67
- 第六章 总结与展望67-69
- 6.1 工作总结67
- 6.2 展望67-69
- 致谢69-70
- 参考文献70-74
- 作者在学期间取得的学术成果74-75
- 附录A 对等模式下通信性能测试详细数据75-78
【相似文献】
中国期刊全文数据库 前10条
1 张东岭;李红真;;浅谈云计算中的安全问题[J];湖南农机;2011年05期
2 陈飞;曹政;王凯;胡农达;安学军;;高性能计算节点中的同步操作加速引擎设计[J];电子科技大学学报;2012年01期
3 ;四层次完成计算——基于HP安腾2服务器的油气储藏模拟解决方案[J];每周电脑报;2003年37期
4 张桂刚;;海量规则网维护及其优化方法[J];计算机应用;2011年03期
5 肖建芳;林东岱;姜中华;;密码计算网格的计算节点控制系统设计与实现[J];计算机工程与设计;2006年16期
6 董唯元;存储+超算,有一点点“繁”[J];中国计算机用户;2005年20期
7 黄锦增;陈虎;赖路双;;异构GPU集群的任务调度方法研究及实现[J];计算机技术与发展;2012年05期
8 邵伟民;廉价构筑您的超级计算机环境(松散集群)[J];胜利油田职工大学学报;2003年04期
9 吕骥;张尧学;周悦芝;;云计算环境中P2P计算的优化组织模型[J];清华大学学报(自然科学版);2011年11期
10 ;网络地图[J];互联网周刊;2002年08期
中国重要会议论文全文数据库 前5条
1 陈飞;曹政;王凯;安学军;;高性能计算节点中的同步操作加速引擎设计[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(B辑)[C];2011年
2 黄献宁;陈燕;宋玲;;基于Linux的HPCC的设计与实现[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
3 王强;刘振安;徐昊;金大鹏;李陆;卢云鹏;赵棣新;Tiago Perez;Johannes Lang;Wolfgang Kuehn;;高性能计算节点智能平台管理模块的设计[A];第十四届全国核电子学与核探测技术学术年会论文集(1)[C];2008年
4 徐昊;李陆;王强;金大鹏;卢云鹏;刘振安;;基于FPGA与ATCA的高性能计算节点的设计[A];第十四届全国核电子学与核探测技术学术年会论文集(上册)[C];2008年
5 徐昊;李陆;王强;金大鹏;卢云鹏;刘振安;;基于FPGA与ATCA的高性能计算节点的设计[A];第十四届全国核电子学与核探测技术学术年会论文集(1)[C];2008年
中国重要报纸全文数据库 前10条
1 一言;戴尔HPCC系统为华中师大尖端课题研究提供计算保障[N];科技日报;2006年
2 吴秉熹 朱振明;GPGPU技术在石油领域的应用[N];计算机世界;2011年
3 《网络世界》记者 周源;IBM推出NeXtScale[N];网络世界;2013年
4 新疆油田公司勘探开发研究院地球物理研究所 张峰;灵活调度提升HPC价值[N];计算机世界;2009年
5 高博;给超级计算机更换“心脏”[N];电脑报;2007年
6 本报记者 荣钰;你会迎接P2P的企业应用吗?[N];网络世界;2008年
7 胡雷钧;计算、存储、通信大协同[N];中国计算机报;2002年
8 风天;IT技术新药研发显身手[N];中华工商时报;2005年
9 肖坤;实现5000亿次的突破[N];中国电脑教育报;2007年
10 本报记者 张群英;蓝色基因演进之路[N];网络世界;2006年
中国博士学位论文全文数据库 前1条
1 丁凡;云环境中高性能计算应用的关键问题研究[D];兰州大学;2014年
中国硕士学位论文全文数据库 前10条
1 林彦宇;异构计算集群调度系统的研究与实现[D];华南理工大学;2015年
2 李强;基于multi-agent的自主调度算法的研究[D];电子科技大学;2014年
3 胡卫;汽车4S店分布式集客识别系统设计与实现[D];西南交通大学;2016年
4 刘立伟;基于多点互备援的高可用服务器管理软件的研究与实现[D];哈尔滨工业大学;2016年
5 吴欢;工业控制环境计算节点安全防护技术研究[D];北京工业大学;2016年
6 徐振;MIC-CPU对等模式下程序优化研究[D];国防科学技术大学;2014年
7 赵莎;分布式海量数据处理系统计算节点的设计与实现[D];电子科技大学;2012年
8 杨荣康;虚拟计算环境中计算节点组件的设计与实现[D];北京邮电大学;2007年
9 张文婷;NoC系统中双核计算节点的设计与实现研究[D];合肥工业大学;2008年
10 时晓星;云计算资源管理机制的研究[D];长春工业大学;2012年
,本文编号:780723
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/780723.html