基于多核的数据并行编程平台的研究与实现
发布时间:2023-06-03 18:24
随着多核处理器的不断发展,应用程序对计算机性能提出了更高的要求,然而由于多核处理器每个核心的处理能力通常都比以往的单核处理器弱,使用多核处理器并不能直接带来高性能,性能提升要靠并行化的应用来实现,尤其对于信息量非常大的应用如图像处理应用,使用数据并行计算是提升性能的主要手段。 然而多数并行应用都是针对特定的多核处理器设计的,与硬件联系过于紧密,针对特定处理器的应用难以移植到其他体系结构的硬件平台,为解决这一问题,本文提出并实现了一个数据并行编程平台,面向图像处理应用,针对不同级别的并行编程需求,提供并行编程语言接口、编程服务API、并行图像算法库三种粒度的编程服务,目的在于使开发人员无须考虑任何硬件的执行细节,专注于并行算法就可以利用编程平台开发出高效的、可移植的、通用的并行程序。 本文的并行编程语言接口是通过对两种典型的并行编程语言进行抽象设计的,具有可扩展性,不仅能够应用于本文实验平台,也能够应用于其他SIMD体系结构的硬件平台,对于平台支持的硬件均采用数据并行技术进行加速,在SIMD处理机上通过硬件自身特点和并行程序设计加速,在PC上使用Intel平台的SSE指令进行加速。 平台...
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题背景
1.2 课题研究现状
1.2.1 SIMD计算机发展现状
1.2.2 并行语言发展状况
1.2.3 并行编程平台发展状况
1.3 本课题研究意义
1.4 本文组织方式
第2章 相关技术介绍
2.1 多核处理器
2.1.1 多核发展
2.1.2 多核处理器特征
2.1.3 体系结构分类与多核体系结构
2.1.4 多核软件研究方向
2.2 并行技术
2.2.1 并行程序设计方法
2.2.2 并行程序性能分析
2.2.3 并行编程模型
2.2.4 Intel平台的SIMD并行计算技术
2.3 图像处理理论
2.3.1 图像处理的主要方法
2.3.2 图像处理技术的应用领域
2.3.3 图像的并行计算需求
2.4 研究目的
2.5 本章小结
第3章 并行编程平台分析与框架设计
3.1 需求分析
3.1.1 平台应用对象及特点
3.1.2 系统需求
3.2 平台体系结构
3.3 平台分层架构
3.3.1 硬件平台分析
3.3.2 编程平台抽象模型
3.3.3 编程服务接口
3.3.4 应用层
3.4 本章小结
第4章 平台详细设计及实现
4.1 并行编程语言接口
4.1.1 数据类型
4.1.2 扩展运算
4.2 编程服务API
4.2.1 图像管理
4.2.2 I/O函数
4.3 并行图像算法库
4.3.1 图像处理流程
4.3.2 图像处理库API设计
4.3.3 典型函数设计
4.4 实现层
4.4.1 PC实现
4.4.2 SIMD硬件实现
4.5 本章小结
第5章 平台应用分析和测试
5.1 平台应用开发过程
5.2 平台应用实例介绍
5.2.1 交通标志识别系统简介
5.2.2 各模块算法与并行策略
5.3 实例结果与性能分析
5.3.1 实验运行环境
5.3.2 平台性能评估
5.4 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
本文编号:3829806
【文章页数】:76 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题背景
1.2 课题研究现状
1.2.1 SIMD计算机发展现状
1.2.2 并行语言发展状况
1.2.3 并行编程平台发展状况
1.3 本课题研究意义
1.4 本文组织方式
第2章 相关技术介绍
2.1 多核处理器
2.1.1 多核发展
2.1.2 多核处理器特征
2.1.3 体系结构分类与多核体系结构
2.1.4 多核软件研究方向
2.2 并行技术
2.2.1 并行程序设计方法
2.2.2 并行程序性能分析
2.2.3 并行编程模型
2.2.4 Intel平台的SIMD并行计算技术
2.3 图像处理理论
2.3.1 图像处理的主要方法
2.3.2 图像处理技术的应用领域
2.3.3 图像的并行计算需求
2.4 研究目的
2.5 本章小结
第3章 并行编程平台分析与框架设计
3.1 需求分析
3.1.1 平台应用对象及特点
3.1.2 系统需求
3.2 平台体系结构
3.3 平台分层架构
3.3.1 硬件平台分析
3.3.2 编程平台抽象模型
3.3.3 编程服务接口
3.3.4 应用层
3.4 本章小结
第4章 平台详细设计及实现
4.1 并行编程语言接口
4.1.1 数据类型
4.1.2 扩展运算
4.2 编程服务API
4.2.1 图像管理
4.2.2 I/O函数
4.3 并行图像算法库
4.3.1 图像处理流程
4.3.2 图像处理库API设计
4.3.3 典型函数设计
4.4 实现层
4.4.1 PC实现
4.4.2 SIMD硬件实现
4.5 本章小结
第5章 平台应用分析和测试
5.1 平台应用开发过程
5.2 平台应用实例介绍
5.2.1 交通标志识别系统简介
5.2.2 各模块算法与并行策略
5.3 实例结果与性能分析
5.3.1 实验运行环境
5.3.2 平台性能评估
5.4 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
本文编号:3829806
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3829806.html