基于OpenMP的多核DSP并行优化方法的研究及应用
本文关键词:基于OpenMP的多核DSP并行优化方法的研究及应用
更多相关文章: Open MP 并行优化 多核DSP H.264
【摘要】:近年来,随着多核处理器逐渐成为市场主流,多核编程标准也愈加受到关注。目前主流的多核编程标准主要有两个:Open MP和MPI。相比于面向消息传递系统结构的多核编程标准MPI,Open MP的使用更加简单与方便,因此以Open MP为代表的面向共享存储系统结构的编程标准随着多核技术的普及与进步而迅速发展。如何能够有效利用Open MP特性,从而最大程度地挖掘程序中潜在的并行性,以及如何探索一系列针对Open MP程序的优化方法,对于未来的多核技术的发展具有十分重要的实践意义与价值。本文的研究工作主要包括以下两个方面:(1)本文以飞腾多核DSP为课题研究背景,从并行计算理论出发,研究了Open MP编程模型及其相关特性,针对Open MP程序的开发流程提出了基于Open MP的并行优化流程,总结了Open MP程序开发过程中的优化方法与策略,并在飞腾多核DSP平台上结合基准测试程序UTDSP对性能优化方法进行了测试,验证了优化方法的有效性。(2)针对开源解码程序FFmpeg的H.264解码部分进行了移植,在飞腾多核DSP平台上利用相关分析工具统计出程序中的热点区域和模块,结合Open MP特性对热点区域和模块进行了优化分析,进而设计并实现了基于Open MP的优化方案,并最终在飞腾多核DSP平台上完成了测试,从而快速而有效地提升了H.264解码程序的性能,使得程序性能获得了近20%的提升,同时也验证了Open MP并行优化所具有高效便捷的优点。
【关键词】:Open MP 并行优化 多核DSP H.264
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP332
【目录】:
- 摘要9-10
- ABSTRACT10-11
- 第一章 引言11-15
- 1.1 课题研究背景11-13
- 1.2 课题研究意义13
- 1.3 主要研究工作13-14
- 1.4 论文组织结构14-15
- 第二章 并行计算与 Open MP 并行优化15-37
- 2.1 并行计算平台15-17
- 2.1.1 共享地址空间平台15-16
- 2.1.2 消息传递平台16
- 2.1.3 嵌入式多核DSP平台16-17
- 2.2 并行算法17-21
- 2.2.1 并行算法分解技术17-18
- 2.2.2 并行算法性能评价18-19
- 2.2.3 并行算法开销分析19-21
- 2.3 Open MP编程模型21-28
- 2.3.1 Open MP简介21-22
- 2.3.2 Open MP编程要素22-25
- 2.3.3 Open MP并行程序开发形式25-26
- 2.3.4 Open MP编程模型中影响性能的因素26-28
- 2.4 基于Open MP的并行优化流程28-32
- 2.4.1 串行程序热点分析29
- 2.4.2 建立并行算法模型29-30
- 2.4.3 测试评价30-32
- 2.4.4 性能优化32
- 2.5 Open MP并行优化方法与策略32-36
- 2.5.1 调整算法结构32
- 2.5.2 优化调度策略32-33
- 2.5.3 重构并行域33-34
- 2.5.4 嵌套循环优化34
- 2.5.5 Cache命中率优化34-36
- 2.6 本章小结36-37
- 第三章 基于Open MP的UTDSP的测试与并行优化37-50
- 3.1 UTDSP简介37
- 3.2 实验平台37-38
- 3.3 UTDSP的测试38-48
- 3.3.1 矩阵乘法38-40
- 3.3.2 快速傅立叶变换40-42
- 3.3.3 DCT压缩42-44
- 3.3.4 图像边缘检测44-46
- 3.3.5 直方图均衡46-48
- 3.4 结果分析48-49
- 3.5 本章小结49-50
- 第四章 基于Open MP的H.264 解码程序的并行优化50-66
- 4.1 H.264 标准概述50
- 4.2 H.264 解码器的选择50
- 4.3 FFmpeg的剪裁与移植50-52
- 4.4 解码程序分析52-53
- 4.4.1 程序结构分析52-53
- 4.4.2 程序热点分析53
- 4.5 并行优化方法53-64
- 4.5.1 Open MP并行化方法53-55
- 4.5.2 熵解码优化55-56
- 4.5.3 运动预测及补偿优化56-59
- 4.5.4 环路滤波优化59-64
- 4.6 试验结果64-65
- 4.7 本章小结65-66
- 第五章 结束语66-68
- 5.1 总结66-67
- 5.2 下一步工作67-68
- 致谢68-69
- 参考文献69-72
- 作者在学期间取得的学术成果72
【参考文献】
中国期刊全文数据库 前9条
1 徐胜利;;利用OpenMP技术实现线性方程组并行求解[J];信息网络安全;2013年05期
2 陈玮;郎涛;;H.264视频解码的OpenMP并行优化[J];计算机系统应用;2011年03期
3 张燕燕;洪龙;;Windows环境下FFT多核并行算法的设计实现[J];计算机技术与发展;2010年09期
4 黄国睿;张平;魏广博;;多核处理器的关键技术及其发展趋势[J];计算机工程与设计;2009年10期
5 任小西;唐玲;张杰;;基于OpenMP多线程动态负载均衡技术研究[J];世界科技研究与发展;2008年03期
6 郑锋;李名世;蔡佳佳;;基于OpenMP的并行遗传算法探讨[J];心智与计算;2007年04期
7 赖建新;胡长军;赵宇迪;王生原;张素琴;;OpenMP任务调度开销及负载均衡分析[J];计算机工程;2006年18期
8 李建江,舒继武,陈永健,王鼎兴,郑纬民;Analysis of Factors Affecting Execution Performance of OpenMP Programs[J];Tsinghua Science and Technology;2005年03期
9 李建江,舒继武,陈永健,王鼎兴;OpenMP源程序级同步段负载监测方法与均衡策略[J];电子学报;2005年05期
,本文编号:711782
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/711782.html