当前位置:主页 > 科技论文 > 计算机论文 >

GPU通用计算中的数据结构组织与应用研究

发布时间:2020-12-24 13:05
  计算机图形处理器(graphics processing unit,简称GPU)用于通用计算的研究现在已经成为一个热门的研究领域。数据结构在GPU下的组织与应用是研究GPU通用计算的前提,没有数据结构的支撑也就不会有GPU下具体的运算实现。本文在对GPU体系结构、编程接口、常用绘制语言及流编程模型的分析基础之上,主要以线性表这一基础的数据结构为研究对象,对其在GPU下的物理结构和逻辑结构进行了详细的分析,从而给出相应的组织方法。通过比较分析提出了一种在GPU下对线性表实现删除和插入运算的方法。论文将数据结构应用于穷举搜索,并通过此应用来讨论GPU下通用计算的性能。由CPU下穷举搜索的性能较差,引出从软件方面将其并行化的改进方法。其次,研究了从硬件方面的改进过程,即如何将穷举搜索移植到GPU环境下,并与CPU下的穷举法进行实验性能对比,通过对测试结果的分析,得出GPU进行通用计算的具体性能指标。最后通过实验得出如下结论:在不考虑带宽影响的情况下,处理的数据规模越大在GPU下执行时越能得到良好的加速比;能够多遍调用渲染操作的算法很适合在GPU下实现,这样可以提高核心算法在计算中的耗时比例,... 

【文章来源】:战略支援部队信息工程大学河南省

【文章页数】:63 页

【学位级别】:硕士

【部分图文】:

GPU通用计算中的数据结构组织与应用研究


顶点处理器流水线结构

处理器,纹理单元,片段,流水线


图6片段处理器和像素流水线川{段处理器调用纹理单元(textureunit)从存储器中读取数据,并选择性的在段处理器之前进行过滤操作。纹理单元支持很多类型的源数据格式,数据可过滤、三线性过滤或各向异性过滤,所有的数据以印32或fP16数据格式返器。一个纹理可以看作是二维或三维的数组,纹理单元可以读取其任意位置段处理器的每条流水线拥有两个fP32格式的绘制单元(shaderunit),片段在循环流动之前,被定向到绘制单元和分支处理器执行后续指令。这种重定钟周期中发生一次。而且,第一个fP32绘制器(shader)可以在需要时用来行透视修正,或用来进行通用的乘法运算。通常来说,在一个时钟周期内8条或更多操作是可能的,或者在第一个绘制单元发生纹理读取则能够执。GPU编程中的流水线结构非图形操作单元方面由于图形硬件的可编程性越来越强大与标准的多边

视图,流水线,视图,可编程


下-万光栅扫描操作,一图7可编程图形流水线orce6系列体系结构[23]为例所展示的其图形流水线简擎,一个可编程片段引擎,一个纹理加载/过滤引擎,(adepth一compare/blendingdatawriteengine)。中,GPU可以被看作是一个具有大量可编程浮点运算实现计算密集型应用而完全与计算机图形无关。

【参考文献】:
期刊论文
[1]图形处理器用于通用计算的技术、现状及其挑战[J]. 吴恩华.  软件学报. 2004(10)
[2]基于图形处理器(GPU)的通用计算[J]. 吴恩华,柳有权.  计算机辅助设计与图形学学报. 2004(05)

硕士论文
[1]基于GPU的串匹配算法的实现[D]. 张庆丹.中国科学院研究生院(计算技术研究所) 2006



本文编号:2935707

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2935707.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户95de6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com