基于计算智能应用映射的GPU体系结构研究
发布时间:2020-07-23 00:50
【摘要】: 2006年NVIDIA发布统一架构的GPU体系结构,推出CUDA编程模型,有利于程序员将通用运算映射至GPU上运行。自此,对于GPU体系结构的研究就成为学者们研究热点。计算智能是以数据为基础,通过训练建立联系,进行问题求解。因其具有智能性而广泛应用于VLSI设计等工程应用各个方面。本文在阅读最新的国内外大量文献的基础上,认为对基于计算智能应用领域内的运算的GPU体系结构进行研究具有重要意义和应用价值。 本文主要工作和创新点: (1)因遗传算法中需要使用大量的随机数,为加快遗传算法的执行速度,对随机数的产生进行专门的研究,提出两种在统一架构GPU上并行产生均匀随机数的方法,且基于统一架构GPU体系结构特征,优化两种产生随机数方法的性能,比较两种方法的效果,选择较好的方法应用于遗传算法中。 (2)深入研究计算智能基本算法中的遗传算法与神经网络算法的基本原理以及其并行化特征。利用统一架构GPU体系结构的特点和其硬件资源,改进遗传算法的并行实现的模型,在统一架构GPU上成功映射遗传算法并优化其性能。并在不影响性能的基础上,改进遗传算法,提高遗传算法的精确性和收敛至最优解的可能性。分别示例遗传算法中在GPU体系结构中遗传代数和种群大小对遗传算法的性能和精确度的影响。以求二次规划问题为实例,成功映射神经网络算法BP模型,并优化其基于统一架构GPU的并行实现,实现一定的性能加速,展示不同数量的神经元与性能的关系。 (3)在应用映射的基础上,将计算智能的两个基本算法在不同的虚拟的GPU体系结构上模拟运行,提取其访存特征,提出并验证一种具有针对性的地址映射机制,实验证明,这种地址映射机制有利于神经网络算法的性能提升。 (4)利用GPU模拟器GPGPU-sim,通过实验阐明GPU体系结构的各组成部分对计算智能应用映射的性能影响,并探讨将来的GPU体系结构发展方向,为基于计算智能领域内的GPU体系结构设计提出建设性的意见,为GPU体系结构的发展奠定实验基础, 本课题研究内容是国家863计划项目“通用流处理器关键技术研究”、“可重构异构流处理器体系结构技术”以及国家资源科学基金项目“面向科学计算异构多流体系结构关键技术研究”的一部分。
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP332
【图文】:
到命令或是数据后,首先进行前端处理,也就是将顶点数据标准化。每个场景模型中的图像都有一定的方向和视角区域,在将目标正确地放置在某个场景中的某个地方时,必须将目标进行标准化,或翻译,或旋转,以配合整个场景的视角。一般标准化的方法是通过一个组合的 4*4 的视图模型矩阵与每个浮点顶点相乘,从而得到一个四维的[x,y,z,w]的视力空间的位置[24]。另外,还需将顶点的位置参数进行格式化,即其转换成一些硬件可以理解的数据格式,并放至顶点 cache 中。其次对顶点进行着色,即在每个顶点上产生光线和颜色。最简单的光照算法就是应用程序为每个顶点计算且分发一个(RGB)的像素值。常用的典型的 GPU 光照的算法就是光线传送的物理平衡模型,其具有全面性、发射性、反射性、漫射性等特点。最后进行三角设置。因为每个顶点的每个边都包含一些参数,这些参数还要用来进行三角设置,通常都有 4 个或是更多这样的参数。在设置中,决定每个Triangle 中包含哪些像素,并为每个像素产生一些必要的信息:比如位置、颜色、每个像素的纹理坐标、光栅的模式、位置取样(是否在这个三角内)等。接下来,使用过滤技术,进行着色(shading)处理,即为每个像素赋予颜色的值。一般情况下,颜色的值由以下因素决定:着色的程序、纹理映射、反射等。
统一架构下的GPU组成示意图
TPC的内部组成
本文编号:2766610
【学位授予单位】:国防科学技术大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP332
【图文】:
到命令或是数据后,首先进行前端处理,也就是将顶点数据标准化。每个场景模型中的图像都有一定的方向和视角区域,在将目标正确地放置在某个场景中的某个地方时,必须将目标进行标准化,或翻译,或旋转,以配合整个场景的视角。一般标准化的方法是通过一个组合的 4*4 的视图模型矩阵与每个浮点顶点相乘,从而得到一个四维的[x,y,z,w]的视力空间的位置[24]。另外,还需将顶点的位置参数进行格式化,即其转换成一些硬件可以理解的数据格式,并放至顶点 cache 中。其次对顶点进行着色,即在每个顶点上产生光线和颜色。最简单的光照算法就是应用程序为每个顶点计算且分发一个(RGB)的像素值。常用的典型的 GPU 光照的算法就是光线传送的物理平衡模型,其具有全面性、发射性、反射性、漫射性等特点。最后进行三角设置。因为每个顶点的每个边都包含一些参数,这些参数还要用来进行三角设置,通常都有 4 个或是更多这样的参数。在设置中,决定每个Triangle 中包含哪些像素,并为每个像素产生一些必要的信息:比如位置、颜色、每个像素的纹理坐标、光栅的模式、位置取样(是否在这个三角内)等。接下来,使用过滤技术,进行着色(shading)处理,即为每个像素赋予颜色的值。一般情况下,颜色的值由以下因素决定:着色的程序、纹理映射、反射等。
统一架构下的GPU组成示意图
TPC的内部组成
【参考文献】
相关期刊论文 前4条
1 马华,张晓清,张鹏鸽;一种基于线性同余算法的伪随机数产生器[J];纯粹数学与应用数学;2005年03期
2 吉根林;遗传算法研究综述[J];计算机应用与软件;2004年02期
3 杨振海;程维虎;;非均匀随机数产生[J];数理统计与管理;2006年06期
4 辛茜,曾晓洋,张国权,郭亚炜;真随机数发生器的系统建模与仿真[J];系统仿真学报;2005年01期
本文编号:2766610
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2766610.html