当前位置:主页 > 科技论文 > 计算机论文 >

面向科学计算的流应用开发与优化

发布时间:2020-09-21 19:42
   流处理器集成了大量的计算单元和软件管理的片上存储器,对于数据密集的媒体应用可以获得极高的计算性能,它具有低主频、低功耗、高数据并行性、高峰值性能等特点。因此,研究在大规模科学和工程计算领域应用流处理器是当前的一个热点问题。 但是,流应用开发和优化方法与传统方法有很大的不同。研究科学计算流应用的开发和优化方法,是探索将流处理器应用于科学计算领域的关键问题之一。 本文在分析了流编程模型和编程语言的基础上,开发了若干典型的科学计算流应用;并针对流体系结构的特点,研究了科学计算流应用的性能优化技术。在自主研制的流处理器——X流处理器上,对这些科学计算流应用进行了测试,测试结果表明本文提出的流程序开发和优化方法能够充分发挥流处理器的性能潜力。 本文主要工作包括: 1、分析了流编程模型的特点,总结了面向科学计算的流应用开发方法,并开发了若干典型的科学计算流应用。 2、针对科学计算应用存在的大量循环结构,提出基于循环变换的流程序优化方法。 3、基于X流处理器平台,对典型科学计算应用核心和若干完整的科学计算应用程序进行了性能测试。计算核心包括:快速傅里叶变换、拉普拉斯变换、稠密矩阵Jacobi迭代、稀疏矩阵Jacobi迭代算法;应用包括:Spec2000 171.Swim、光学应用Capao和偏微分方程求解。测试结果表明本文提出的面向科学计算的流应用开发和优化方法能够充分发挥流处理器的性能优势。
【学位单位】:国防科学技术大学
【学位级别】:硕士
【学位年份】:2006
【中图分类】:TP332
【部分图文】:

流程图,萃取处理,流程


国防科学技术大学研究生院工学硕士学位论文性相对应,实质为一种时间局部性;核心之间的局部性是指前一核心产生的一批数据作为下一核心的输入,是一种生产者-消费者的局部性,更多体现出空间局部性的特征。流应用中的空间局部性是粗粒度的,有别于通用处理器中 Cache 捕捉的细粒度局部性。4、数据引用的规律性媒体应用和一些科学计算应用往往按照一定规律对数据进行引用,比如按顺序方式、固定步长方式进行引用,并且引用规律在程序设计时便能预先确定。流应用这种可预测的访存特性,为实现预取提供了可能。

体系结构图,单片,体系结构,程序员


图 1.2 单片 VIRAM 体系结构IT 大学开发的 Raw[25]体系结构是 Tile 体系结构的典型代表,一个 R 16 个可编程的 Tile 组成。每个 Tile 都有单独的微处理器、数据 ca及同连接各个 Tiles 的互连网络的接口,其结构如图 1.3 所示。RAW并行,分空间执行,把底层的物理资源如门、线、引脚等作为体系露给程序员,使程序员面对线延迟,更好的安排程序从而获得最佳

模块图,处理器,模块,程序员


图 1.2 单片 VIRAM 体系结构MIT 大学开发的 Raw[25]体系结构是 Tile 体系结构的典型代表,一个 RAW 器由 16 个可编程的 Tile 组成。每个 Tile 都有单独的微处理器、数据 cache、器以及同连接各个 Tiles 的互连网络的接口,其结构如图 1.3 所示。RAW 适合程级并行,分空间执行,把底层的物理资源如门、线、引脚等作为体系结构体暴露给程序员,使程序员面对线延迟,更好的安排程序从而获得最佳性能。

【相似文献】

相关期刊论文 前10条

1 张春元;文梅;伍楠;荀长庆;吴伟;;二维拉格朗日和欧拉结合法在流处理器MASA上的实现与评测[J];国防科技大学学报;2006年04期

2 隋兵才;罗礼;毛二坤;;64位流处理器中运算群的设计与验证[J];计算机与现代化;2007年11期

3 杨学军;晏小波;唐滔;;流处理器技术研究与发展[J];计算机工程与科学;2008年04期

4 文梅;李海燕;伍楠;张春元;李礼;;流体系结构抽象模型研究[J];计算机工程与科学;2006年07期

5 王湘新;;流体系结构和Imagine[J];微型电脑应用;2007年08期

6 伍楠;吴伟;文梅;杨乾明;柴俊;张春元;;梅森素数并行求解算法的流式实现[J];计算机工程与科学;2007年11期

7 周丽萍;安虹;徐光;王耀彬;;多媒体基准测试程序中的流并行性分析[J];计算机科学;2009年05期

8 苏华友;伍楠;文梅;任巨;吴伟;张春元;;高清H.264变换编码的流式实现[J];计算机工程与科学;2011年08期

9 李礼;文梅;伍楠;李海燕;张春元;;流处理器延迟隐藏机制的优化及实现[J];计算机工程与科学;2007年03期

10 曹维;车永刚;王正华;;地球引力位函数在流处理器上的实现与分析[J];计算机工程;2009年06期

相关博士学位论文 前7条

1 晏小波;FT64流处理技术:体系结构、编程语言、编译技术及编程方法[D];国防科学技术大学;2007年

2 文梅;流体系结构关键技术研究[D];国防科学技术大学;2006年

3 伍楠;高效能流体系结构关键技术研究[D];国防科学技术大学;2008年

4 杜静;流体系结构的编译技术研究[D];国防科学技术大学;2008年

5 张英;面向科学计算流处理器的编译存储优化技术研究[D];国防科学技术大学;2008年

6 马驰远;流体系结构存储系统的设计实现及性能优化研究[D];国防科学技术大学;2007年

7 何义;流体系结构指令管理及系统虚拟化仿真技术研究[D];国防科学技术大学;2010年

相关硕士学位论文 前10条

1 王桂彬;面向科学计算的流应用开发与优化[D];国防科学技术大学;2006年

2 赵天磊;流体系结构模拟器及模拟验证技术研究[D];国防科学技术大学;2006年

3 伍楠;流处理器MASA内核的研究及实现[D];国防科学技术大学;2005年

4 闫晓峰;流体系结构模拟器的优化与实现[D];国防科学技术大学;2008年

5 谈民;X流处理器主机接口部件设计与实现[D];国防科学技术大学;2006年

6 齐树波;流寄存器文件的研究与实现[D];国防科学技术大学;2006年

7 李礼;流体系结构存储访问机制的研究[D];国防科学技术大学;2006年

8 杨乾明;多核流体系结构模拟器研究与实现[D];国防科学技术大学;2008年

9 李海燕;H.264编码核心算法在流体系结构上的实现[D];国防科学技术大学;2005年

10 汤明;流存储控制系统技术研究及硬件实现[D];国防科学技术大学;2006年



本文编号:2823915

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2823915.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户25cf9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com