基于CUDA平台的有限元单元级别并行算法研究
【学位单位】:沈阳工业大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TM15
【部分图文】:
沈阳工业大学硕士学位论文14图2.1 网格剖分图Fig. 2.1 Mesh subdivision以单元(1)为例,该单元的单元系数矩阵为:(1) (1) (1)11 12 14(1) (1) (1) (1)21 22 24(1) (1) (1)41 42 44= A A AA A A AA A A(2.25)单元(1)的系数矩阵对总体系数矩阵的贡献为:(1) (1) (1)11 12 14(1) (1) (1)21 22 24(1)(1) (1) (1)41 42 430 0 00 0 00 0 0 0 0 0 =0 0 00 0 0 0 0 00 0 0 0 0 0 A A AA A AAA A A(2.26)由节点联系矩阵的特点能够得到单元(1)的节点联系矩阵,具体形式如下:(1)1 0 0 0 0 0= 0 1 0 0 0 00 0 0 1 0 0 Q (2.27)同理可得,其余三个单元的节点联系矩阵(2)Q ,(3)Q ,(4)Q 的具体形式,根据公式(2.17)得到总体联系矩阵 Q。以单元(1)为例,节点变量?
通过 PCI-E 总线将其与 CPU 相连才能够进行工作。它在显卡中发挥着是显卡中必不可少的一部分。不同的 GPU 架构的设计理念、工艺水平的结构和性能也不一样。不同的架构拥有不同的计算能力。接下来分U 的具体硬件特性。orce GTX-960M 采用的是基于 Maxwell 架构的 GM206 核心(如图 架构对流多处理器(Streaming Multiprocessor,SM)进行了升级,变为处理器(如图 3.2)中包含了 128 个 CUDA 核心、32 个特殊功能单元 Unit,SFU)、32 个存取单元(load/store unites,LD/ST)、4 个指令分调度器和 4 个线程束调度器。即本文在此硬件架构下使用算法程序进行SM 上能够同时发送和执行 4 个线程束,能够在每个时钟内启动 8 架构由内存控制器、图形处理器簇(Graph Processing Cluster,GPC)、CI-E 接口构成。其中,每个 GPC 由一个光栅单元和 4 个 SMM 构成,PC。即本文进行并行计算时,能够同时执行 16 个流多处理器。
图3.2 SMM 架构Fig. 3.2 Architecture of SMM体系开发的基本软件环境由 CUDA 库函数(CUDA Library)、及行业标准程序语言的扩展(包括 C、C++、Fortran 等)构体系。CUDA C++是标准 ANSI C 语言的一个扩展,带有少程成为可能,同时也能通过 API 来管理设备、内存和其他任进行编译时,会将在 GPU 上运行的代码与 CPU 上运行的将在 GPU 上运行的代码编译为 PTX 代码,而在 CPU 上运行编译,并通过 C 文件的方式给出。CUDA 提供了 CUDAAPI 两层 API 来管理 GPU 设备和组织线程。在一个程序中只 CUDA driver API 的其中一种,本文使用的是 CUDA runtim
【相似文献】
相关期刊论文 前10条
1 陈国良;孙广中;徐云;吕敏;;并行算法研究方法学[J];计算机学报;2008年09期
2 陈国良;昔日王榭堂前燕,飞入寻常百姓家浅谈并行算法[J];新电脑;2002年12期
3 方同祝;并行算法在系统仿真中的应用[J];微机发展;1999年04期
4 寿标,李晓峰;更实际的并行算法的设计[J];计算机研究与发展;1996年06期
5 韩晓言,韩祯祥;预处理并轭梯度法在电力系统暂态稳定分析并行算法中的应用研究[J];电力系统及其自动化学报;1996年02期
6 李庆华,陆枫;使用《并行算法的设计与分析》一书作教材的体会[J];教育与现代化;1996年03期
7 张朝阳,王海期,孙炳楠,唐锦春;多跨输电线平面振动特性的并行算法[J];华中理工大学学报;1997年04期
8 许丹柯;;并行计算机选型及并行算法评估[J];石油工业计算机应用;1994年02期
9 王川龙,郭耀鹏;H-分裂与并行算法[J];工程数学学报;1995年03期
10 朱方生;线性二次型最优控制的并行算法和软件[J];武汉大学学报(自然科学版);1995年03期
相关会议论文 前10条
1 焦龙;郭亚红;纪守领;李金宝;;基于多核计算机的分子动力学并行算法的实现[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
2 姚向东;;并行算法到并行结构的映射[A];中国工程物理研究院科技年报(2001)[C];2001年
3 王轶;席裕庚;;自适应极点配置器设计中的并行算法[A];1994中国控制与决策学术年会论文集[C];1994年
4 高华;苗世光;;城市小区尺度模式并行算法研究[A];中国气象学会2006年年会“中尺度天气动力学、数值模拟和预测”分会场论文集[C];2006年
5 张衡;张武;;三维抛物型初边值问题的块三对角可扩展并行算法[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
6 樊洪明;李先庭;赵彬;任鸿泽;;有限元分布式并行算法研究[A];全国暖通空调制冷2002年学术年会论文集[C];2002年
7 王雷章;张爱武;刘晓萌;;三维建模中平面分割并行算法的设计与实现[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
8 陈平;乔秀全;刘臻;田小萍;;数据挖掘网格中决策树并行算法设计及性能分析[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年
9 林伟军;王秀明;张海澜;;弹性波在非均匀各向异性介质中的传播模拟及其并行算法[A];2004年全国物理声学会议论文集[C];2004年
10 邓力;张文勇;刘杰;许海燕;王瑞宏;李树;;非定常粒子输运蒙特卡罗并行算法研究[A];中国工程物理研究院科技年报(2003)[C];2003年
相关重要报纸文章 前10条
1 ;并行算法研究进展[N];中国计算机报;2004年
2 新华社记者 奚启新 本报通讯员 李汛 记者 喻国英;精彩人生[N];光明日报;2005年
3 新华社记者 奚启新 本报记者 廖文根;三次选择 无怨无悔[N];人民日报;2005年
4 记者 温婷;中国超算再度登顶全球500强[N];上海证券报;2016年
5 ;名师上讲台:每堂课都是精心编排的演出[N];科技日报;2006年
6 宋宇;高性能计算面临三大难题[N];中国计算机报;2000年
7 本报记者 赵波 本报特约记者 刘程 本报通讯员 章立丁;一位巾帼学者的无悔征程[N];解放军报;2005年
8 宋家雨;混合型高性能计算落户深圳[N];网络世界;2007年
9 清华大学计算机系 薛巍;电网仿真考验高性能计算[N];计算机世界;2006年
10 陈文光 郑纬民;高性能计算的三大研究领域[N];计算机世界;2006年
相关博士学位论文 前10条
1 潘斌;几何定理机器证明并行算法研究[D];中国科学院研究生院(成都计算机应用研究所);2006年
2 曾清红;无网格数值模拟的并行算法及并行实现研究[D];中国科学技术大学;2006年
3 杜云飞;容错并行算法的研究与分析[D];国防科学技术大学;2008年
4 雷国庆;基于FPGA的图计算并行算法和体系结构研究[D];国防科学技术大学;2015年
5 李雪宝;太阳望远镜海量数据并行处理技术研究[D];中国科学院研究生院(云南天文台);2015年
6 邬贵明;FPGA矩阵计算并行算法与结构[D];国防科学技术大学;2011年
7 廖臣;三维电磁粒子模拟并行算法及其应用研究[D];电子科技大学;2010年
8 李鸿健;并行算法在激光化学反应模拟中的应用研究[D];电子科技大学;2012年
9 吴超;信息检索中top-k问题的并行算法及优化研究[D];中国科学技术大学;2011年
10 杜刘革;基于多GPU的FDTD并行算法及其在电磁仿真中的应用[D];山东大学;2011年
相关硕士学位论文 前10条
1 王晟;基于CUDA平台的有限元单元级别并行算法研究[D];沈阳工业大学;2019年
2 邓大博;基于Spark计算框架下的带容量约束的车辆路径问题并行算法研究[D];厦门大学;2017年
3 段素霞;二维中子输运问题的特征线并行算法研究[D];国防科学技术大学;2017年
4 任沂斌;高性能集群下LiDAR数据生成DEM并行算法研究[D];南京大学;2015年
5 洪文杰;基于申威处理器的PETSc异构并行算法设计和研究[D];湖南大学;2018年
6 赵涛;一种三维非定常线弹性问题的自适应并行算法[D];湘潭大学;2018年
7 唐光平;基于三对角线性方程组的混合并行算法研究[D];湖南大学;2015年
8 聂双;综合孔径微波辐射计图像反演并行算法研究[D];华中科技大学;2017年
9 陈长吉;适用于深度学习的数据预处理并行算法实现及性能优化[D];上海海洋大学;2018年
10 许丹丹;CPU-GPU协同异构环境下卡尔曼滤波的并行算法研究[D];湖南大学;2017年
本文编号:2826848
本文链接:https://www.wllwen.com/kejilunwen/dianlidianqilunwen/2826848.html