基于高性能计算机的并行计算研究
发布时间:2022-09-29 14:31
并行计算是计算机研究领域中的热点问题之一,各国争相投入巨资开发运算速度更快的高性能计算系统,本文就机群中单个节点的并行计算能力进行研究,完成的主要研究工作如下: (1)研究64位微处理的特点和SIMD指令的使用,详细介绍了64位开发环境的搭建步骤及方法,简单介绍了SIMD指令的使用并通过一个图像处理程序定量的对使用SIMD指令后产生的加速效果进行了分析。 (2)通过对各种并行硬件平台分析研究,采用操作系统提供的多线程编程方法,以解稠密线性方程组的高斯消元法为例,分析了按行分块和按列分块两种实现静态负载均衡分块方法的优劣。然后以按行分块为例,提出了各种同步解决方法并对提出的同步方法在多核并行平台、超线程并行平台、多处理器并行平台下分别进行测试,比较它们在各种并行平台下的表现,进而提出通过进一步细分块来减少同步,提高并行度的方法。通过对实验数据的分析总结,提出开发多线程并行程序的一般步骤方法。通过实验验证了对于多处理器结构适合采用按行连续分块,而对多核以及超线程并行适合采用按行交叉分块。
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题背景及研究意义
1.2 国内外的研究现状
1.2.1 并行算法研究
1.2.2 机群的研究现状
1.2.3 基于机群的并行算法实现研究
1.3 论文的主要工作及内容安排
1.3.1 主要工作
1.3.2 章节安排
2 并行计算
2.1 并行计算基本概念
2.2 并行程序性能评价方法
2.2.1 并行程序执行时间
2.2.2 加速系数
2.2.3 效率
2.3 基于多核并行程序优化原理
3 高性能并行平台研究
3.1 SIMD指令研究
3.1.1 SIMD指令特点研究
3.1.2 SIMD使用环境配置
3.1.3 SIMD使用测试
3.2 超线程技术
3.3 多核处理器
3.4 对称多处理器
3.5 GPU
4 并行计算研究
4.1 并行计算实现方法
4.2 多线程编程
4.2.1 进程和线程基本概念
4.2.2 线程操作的基本函数
4.2.3 线程间同步方法研究
4.3 静态负载均衡
4.4 线程间同步策略研究
4.4.1 逻辑读优先
4.4.2 实时读优先
4.4.3 实时写优先
4.4.4 复制写
4.4.5 抢占
4.5 执行流程优化
4.6 并行粒度研究
5 并行计算实现与测试数据分析
5.1 多核并行测试
5.1.1 分块方法测试
5.1.2 逻辑读优先与实时读优先测试
5.1.3 实时读优先与写优先测试
5.1.4 实时写优先与写复制测试
5.1.5 执行流程优化测试
5.1.6 细分快避免冲突策略测试
5.1.7 小结
5.2 多处理器并行测试
5.3 数据连续与交叉分块影响研究
5.4 超线程并行测试
结论
参考文献
致谢
【参考文献】:
期刊论文
[1]基于MPI与OpenMP混合并行计算技术的研究[J]. 李苏平,刘羽,刘彦宇. 软件导刊. 2010(03)
[2]TBB多核编程及其混合编程模型的研究[J]. 胡斌,袁道华. 计算机技术与发展. 2009(02)
[3]走进多核时代[J]. 李晓明,王韬,刘东,杜江凌. 计算机科学与探索. 2008(06)
[4]多核处理器大规模并行系统中的任务分配问题及算法[J]. 刘轶,张昕,李鹤,钱德沛. 小型微型计算机系统. 2008(05)
[5]基于多核集群系统的并行编程模型的研究[J]. 胡晨骏,王晓蔚. 计算机技术与发展. 2008(04)
[6]PC集群环境下大规模矩阵乘法算法的研究[J]. 夏丽华,张丽晓. 计算机工程与设计. 2007(19)
[7]64位环境SIMD性能优化技术研究[J]. 李璞,孙亚辉. 计算机与信息技术. 2007(04)
[8]64位环境SIMD性能优化技术研究[J]. 李璞,孙亚辉. 计算机与信息技术. 2007 (04)
[9]改进的并行高斯全主元消去法[J]. 孙济洲,樊莉亚,孙敏,于策,张绍敏. 天津大学学报. 2006(09)
[10]SIMD技术在数字图像处理中的应用研究(英文)[J]. 辛明瑞,高德远,佟凤辉. 微电子学与计算机. 2004(11)
博士论文
[1]SMP机群上的并行代码优化技术[D]. 陈莉.中国科学院研究生院(计算技术研究所) 2002
本文编号:3682765
【文章页数】:58 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 课题背景及研究意义
1.2 国内外的研究现状
1.2.1 并行算法研究
1.2.2 机群的研究现状
1.2.3 基于机群的并行算法实现研究
1.3 论文的主要工作及内容安排
1.3.1 主要工作
1.3.2 章节安排
2 并行计算
2.1 并行计算基本概念
2.2 并行程序性能评价方法
2.2.1 并行程序执行时间
2.2.2 加速系数
2.2.3 效率
2.3 基于多核并行程序优化原理
3 高性能并行平台研究
3.1 SIMD指令研究
3.1.1 SIMD指令特点研究
3.1.2 SIMD使用环境配置
3.1.3 SIMD使用测试
3.2 超线程技术
3.3 多核处理器
3.4 对称多处理器
3.5 GPU
4 并行计算研究
4.1 并行计算实现方法
4.2 多线程编程
4.2.1 进程和线程基本概念
4.2.2 线程操作的基本函数
4.2.3 线程间同步方法研究
4.3 静态负载均衡
4.4 线程间同步策略研究
4.4.1 逻辑读优先
4.4.2 实时读优先
4.4.3 实时写优先
4.4.4 复制写
4.4.5 抢占
4.5 执行流程优化
4.6 并行粒度研究
5 并行计算实现与测试数据分析
5.1 多核并行测试
5.1.1 分块方法测试
5.1.2 逻辑读优先与实时读优先测试
5.1.3 实时读优先与写优先测试
5.1.4 实时写优先与写复制测试
5.1.5 执行流程优化测试
5.1.6 细分快避免冲突策略测试
5.1.7 小结
5.2 多处理器并行测试
5.3 数据连续与交叉分块影响研究
5.4 超线程并行测试
结论
参考文献
致谢
【参考文献】:
期刊论文
[1]基于MPI与OpenMP混合并行计算技术的研究[J]. 李苏平,刘羽,刘彦宇. 软件导刊. 2010(03)
[2]TBB多核编程及其混合编程模型的研究[J]. 胡斌,袁道华. 计算机技术与发展. 2009(02)
[3]走进多核时代[J]. 李晓明,王韬,刘东,杜江凌. 计算机科学与探索. 2008(06)
[4]多核处理器大规模并行系统中的任务分配问题及算法[J]. 刘轶,张昕,李鹤,钱德沛. 小型微型计算机系统. 2008(05)
[5]基于多核集群系统的并行编程模型的研究[J]. 胡晨骏,王晓蔚. 计算机技术与发展. 2008(04)
[6]PC集群环境下大规模矩阵乘法算法的研究[J]. 夏丽华,张丽晓. 计算机工程与设计. 2007(19)
[7]64位环境SIMD性能优化技术研究[J]. 李璞,孙亚辉. 计算机与信息技术. 2007(04)
[8]64位环境SIMD性能优化技术研究[J]. 李璞,孙亚辉. 计算机与信息技术. 2007 (04)
[9]改进的并行高斯全主元消去法[J]. 孙济洲,樊莉亚,孙敏,于策,张绍敏. 天津大学学报. 2006(09)
[10]SIMD技术在数字图像处理中的应用研究(英文)[J]. 辛明瑞,高德远,佟凤辉. 微电子学与计算机. 2004(11)
博士论文
[1]SMP机群上的并行代码优化技术[D]. 陈莉.中国科学院研究生院(计算技术研究所) 2002
本文编号:3682765
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3682765.html