当前位置:主页 > 科技论文 > 计算机论文 >

基于FT-C6XX多核DSP的MPI移植实现与优化

发布时间:2017-03-28 13:17

  本文关键词:基于FT-C6XX多核DSP的MPI移植实现与优化,由笔耕文化传播整理发布。


【摘要】:FT-C6XX多核DSP(Digital Signal Processor)是由国防科学技术大学计算机学院微电子所自主研发的一款高性能多核数字信号处理器,该芯片主要应用于高新能计算领域。为FT-C6XX多核DSP开发多核并行编程环境对该芯片的应用推广有很大益处,是该项目目前较为重要的工作之一。本文结合FT-C6XX多核DSP的体系结构特征,将MPI(Message Passing Interface)并行编程环境移植到FT-C6XX多核DSP平台上,并对多核间通信方式进行了优化,测试结果表明了本文移植工作的正确性与优化工作的有效性。本文主要的研究内容及贡献包括以下四个方面:(1)总结了基于MPI并行编程环境开发FT-C6XX多核应用程序的方法:主要是将一个串行程序MPI并行化,具体步骤为:分解任务,分配任务,协调进程,进程映射到处理器这几步。(2)基于FT-C6XX体系结构移植实现了MPI并行编程环境:首先移植编译相关工具链:二进制工具集binutils、GCC编译器、u Clibc库生成FT-C6XX多核DSP的交叉编译环境;然后从通信模块、同步模块两个方面将MPI并行编程环境移植到FT-C6XX多核DSP平台上;最后编译生成FT-C6XX多核DSP平台支持的MPI可执行代码。(3)对FT-C6XX的MPI通信性能进行了优化:主要是针对共享内存消息传递方法管理以及长消息传递两个问题,采用消息队列和单拷贝的DMA技术分别对其进行优化。(4)对FT-C6XX的MPI并行编程环境进行测试:通过三个测试用例,π值计算cpi.c、矩阵乘法matrix.c、快速傅里叶变换fft.c验证了移植工作的正确性;通过测试快速傅里叶变换fft.c在优化前后的程序性能,表明优化后程序性能得了10%左右的提升。
【关键词】:多核DSP MPI移植 通信优化
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP332
【目录】:
  • 摘要10-11
  • ABSTRACT11-12
  • 第一章 绪论12-20
  • 1.1 研究背景与意义12-15
  • 1.1.1 多核技术的发展及挑战12-13
  • 1.1.2 课题来源13-15
  • 1.2 国内外相关研究15-18
  • 1.2.1 共享变量模型15
  • 1.2.2 数据并行模型15-16
  • 1.2.3 消息传递模型16-18
  • 1.2.3.1 MPI现有的实现16-17
  • 1.2.3.2 MPI研究热点17-18
  • 1.3 论文主要工作18-19
  • 1.4 论文组织结构19-20
  • 第二章 MPI程序设计与性能评估20-29
  • 2.1 MPI并行程序设计方法20-25
  • 2.1.1 MPI并行程序设计步骤20-21
  • 2.1.2 矩阵乘法MPI设计实例21-25
  • 2.2 MPI并行程序性能分析25-27
  • 2.2.1 执行时间25-26
  • 2.2.2 加速比与效率26-27
  • 2.3 MPI并行程序开销分析27-28
  • 2.4 本章小结28-29
  • 第三章 基于FT-C6XX多核DSP的MPI移植实现29-58
  • 3.1 实验平台、开发调试环境介绍以及调试步骤分析29-31
  • 3.1.1 实验平台、开发调试环境介绍29-30
  • 3.1.2 在FT-C6XX多核DSP上调试MPI程序步骤分析30-31
  • 3.2 MPICH总体结构31-33
  • 3.2.1 MPI接口实现层31-32
  • 3.2.2 MPI抽象设备层32-33
  • 3.2.3 MPI通道接口层33
  • 3.3 移植过程分析及移植难点33-36
  • 3.3.1 移植实现过程分析33-35
  • 3.3.2 MPI移植难点分析35-36
  • 3.4 binutils二进制工具集移植36-38
  • 3.4.1 BFD库的移植36-37
  • 3.4.2 汇编器GNU AS移植37-38
  • 3.4.3 链接器GNU LD移植38
  • 3.5 GCC编译器移植38-41
  • 3.5.1 ftc6xx.h文件39
  • 3.5.2 ftc6xx.c文件39-40
  • 3.5.3 ftc6xx.md文件40-41
  • 3.6 uclibc库的移植41-42
  • 3.7 MPI的通信模块移植实现42-50
  • 3.7.1 基于FT-C6XX多核DSP的MPI核间共享内存实现42-46
  • 3.7.1.1 共享内存初始化43-45
  • 3.7.1.2 共享内存动态申请45
  • 3.7.1.3 共享内存动态释放45-46
  • 3.7.2 基于FT-C6XX多核DSP的MPI消息队列实现46-48
  • 3.7.2.1 消息队列创建与释放46-47
  • 3.7.2.2 消息队列的初始化47
  • 3.7.2.3 消息队列管理47-48
  • 3.7.3 基于共享内存SM的消息传递方法48-50
  • 3.8 多核通信同步方式的移植实现50-56
  • 3.8.1 基于核间中断管理的同步方式50-52
  • 3.8.2 基于核间共享信号量的同步方式52-54
  • 3.8.2.1 信号量管理的工作原理52-53
  • 3.8.2.2 创建/删除一个信号量53-54
  • 3.8.3 基于栅栏的核间任务同步方式54-56
  • 3.8.3.1 在FT-C6XX多核DSP上设计栅栏54-55
  • 3.8.3.2 栅栏的初始化55-56
  • 3.9 MPI的配置及编译56-57
  • 3.10 本章小结57-58
  • 第四章 FT-C6XX的MPI进程间通信性能优化58-68
  • 4.1 基于共享内存的消息队列的消息传递方法及其优化方法58-62
  • 4.1.1 基于共享内存的消息队列的消息传递方法58-59
  • 4.1.2 使用lock_free_queue对消息传递方法进行优化59-60
  • 4.1.3 Fastbox的旁路队列机制60-61
  • 4.1.4“影子指针”的使用61-62
  • 4.2 单拷贝技术的应用62-65
  • 4.3 FT-C6XX多核DSP上基于MPI的DMA消息传递方法65-67
  • 4.3.1 直接使用DMA搬移方式的消息传递方法65-66
  • 4.3.2 基于nemesis通道的LMT接口的DMA消息传递方法66-67
  • 4.4 本章小结67-68
  • 第五章 基于FT-C6XX多核DSP的MPI程序性能测试68-83
  • 5.1 用数值积分法计算圆周率π68-72
  • 5.1.1 计算圆周率π的MPI并行算法68-70
  • 5.1.2 π值计算MPI并行程序测试结果及分析70-72
  • 5.2 矩阵运算并行计算72-77
  • 5.2.1 矩阵乘法算法分析72-73
  • 5.2.2 矩阵乘法MPI并行程序测试及分析73-77
  • 5.3 fft快速傅里叶变换算法77-82
  • 5.3.1 对MPI进程间通信性能优化前fft.c程序测试及分析77-79
  • 5.3.2 对MPI进程间通信性能优化后fft.c程序测试及分析79-82
  • 5.4 本章小结82-83
  • 第六章 总结与展望83-85
  • 6.1 全文总结83-84
  • 6.2 展望84-85
  • 致谢85-86
  • 参考文献86-89
  • 作者在学期间取得的学术成果89

【相似文献】

中国期刊全文数据库 前10条

1 逄焕众;用于进程间通信的消息队列探讨[J];中国金融电脑;1998年08期

2 周世杰;刘锦德;秦志光;;消息队列技术研究:综述与一个实例[J];计算机科学;2002年02期

3 孟昭勇;对“消息”的初步认识[J];现代制造工程;2003年S1期

4 邓波;防止消息队列阻塞的办法[J];华南金融电脑;2003年06期

5 杜毅,杨金生,吴震华;Linux消息队列分析及应用[J];计算机工程;2004年S1期

6 王强;在数据库开发中巧用消息队列[J];计算机与现代化;2005年11期

7 曹婧华;冉彦中;许志军;;分布式消息队列的设计与实现[J];河南科技大学学报(自然科学版);2010年04期

8 穆荣均;;消息队列漫谈[J];程序员;2010年11期

9 JEFF PROSISE ,杨慧中;第二消息循环[J];个人电脑;1995年07期

10 沈华峰;;如何实现进程通信的程序设计——消息队列方法[J];上海微型计算机;1998年16期

中国重要会议论文全文数据库 前2条

1 张磊;陈荦;吴秋云;李军;;基于消息队列的分布式信息查询技术的研究与实现[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

2 郭杰;;基于NoSQL的持久化消息队列设计实现[A];全国冶金自动化信息网2014年会论文集[C];2014年

中国重要报纸全文数据库 前7条

1 杨海平 姚洪利;多线程数据共享与线程同步[N];中国计算机报;2001年

2 刘锬;实现嵌入式系统并发任务间的通信[N];计算机世界;2005年

3 谌力;Sun谨慎开源Java核心[N];网络世界;2006年

4 ;详解.NET的RAD功能[N];中国计算机报;2001年

5 中石油昆仑天然气利用有限公司 谢枭;定位系统 守护危险化学品运输[N];计算机世界;2011年

6 于翔;微软公开M语言加快开放步伐[N];网络世界;2008年

7 《网络世界》记者 于翔;Oracle Tuxedo将针对Exalogic展开持续优化[N];网络世界;2012年

中国博士学位论文全文数据库 前2条

1 卢本捷;分布式消息队列的理论、实现与应用[D];华中科技大学;2004年

2 苑洪亮;基于内容的“发布/订阅”若干关键技术研究[D];国防科学技术大学;2006年

中国硕士学位论文全文数据库 前10条

1 袁浩东;基于LabVLEW的通用数据采集系统的设计[D];西南交通大学;2015年

2 史须勇;ICT通信服务器体系结构的设计与实现[D];中国科学院研究生院(沈阳计算技术研究所);2015年

3 黄宝铖;游戏精准营销中转服务器的设计与实现[D];哈尔滨工业大学;2015年

4 陈瑶;基于Node.js高并发web系统的研究与应用[D];电子科技大学;2014年

5 邓文;川庆公司云模式网络预警系统的设计与实现[D];电子科技大学;2014年

6 宋强;基于windows平台的分布式控制系统设计[D];西安电子科技大学;2014年

7 张晶;智慧交通OD分析系统的设计和构建[D];南京邮电大学;2015年

8 李泽平;嵌入式微系统msOS的设计与应用[D];江西科技师范大学;2015年

9 刘海涛;武警部队(支队级)勤务管理系统设计与开发[D];西安工程大学;2015年

10 廖坤;基于FT-C6XX多核DSP的MPI移植实现与优化[D];国防科学技术大学;2015年


  本文关键词:基于FT-C6XX多核DSP的MPI移植实现与优化,由笔耕文化传播整理发布。



本文编号:272352

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/272352.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3edc9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com