基于CUDA的离散元法DEM实现方法的改进
本文选题:GPU + OpenCL ; 参考:《吉林大学》2017年硕士论文
【摘要】:DEM(Discrete Element Method)离散元法是一种数值模拟仿真方法,在研究并分析大量颗粒物体在运动过程中产生相互作用方面颇有成效,是目前为止最为流行的一种分析方法,最先由Cundall提出。它的理论核心是离散化运动过程中的非连续物体,从而通过公式计算出非连续体的整体运动状态。快速的计算、较小存储空间的需求是DEM离散元法的特点。本课题组持续多年的研究,对离散元法的理论架构和体系结构有了深入的了解。但是当进行大规模数量的颗粒的运算时仍然会出现由于计算时间过长导致的计算结果不及预期的现象。本课题组成员针对上述问题提出了一种解决方法,使用GPU来替代CPU,从而加快计算速度。GPU在单核性能方面远不及CPU,如处理复杂逻辑算法方面GPU相对CPU稍逊一些;但是在多个核心的并发方面,GPU的并发能力要远远超过CPU,该比例可达1~2个数量级。为了达到GPU替代CPU的目的,该成员使用了并行计算架构Open CL。Open CL是较为普遍的并行计算架构,不局限于硬件条件,因此经常受到大多数科研人员的青睐。但是,在性能与精确度方面,远不如CUDA并行计算架构,如在处理双精度数值时,由于Open CL只能处理单精度,在计算结果中会出现较大的误差。CUDA是由NVIDIA公司提出的一种并行计算架构。该计算架构提供了双精度运算,同时还提供了大量丰富的API,在提高开发效率的同时降低了实现设备端程序的成本。本论文在已有的理论基础与算法之上,使用CUDA,对以Open CL颗粒系统进行改进,从而满足了运算速度与精确度的要求。通过大量数据的测试,CUDA颗粒系统的计算结果与Open CL颗粒系统的计算结果相似,在使用相同计算参数时程序的运行时间差别不大,但是在颗粒细微运动下的仿真效果更为精确。同时,根据算法和CUDA并行计算架构的特点,对CUDA颗粒系统进行优化,从而进一步加快运行速度。最后,本论文对CUDA颗粒系统进行了全面测试,通过颗粒与颗粒、颗粒与多种图元边界碰撞的测试来分析CUDA颗粒系统的正确性以及运行效率。
[Abstract]:DEM(Discrete Element method discrete element method is a numerical simulation method, which is very effective in studying and analyzing the interaction of a large number of particles in the process of motion. It is the most popular analysis method by far, first proposed by Cundall. The core of its theory is the discontinuous object in the process of discrete motion, and the whole motion state of the discontinuous body is calculated by the formula. Fast calculation and small storage space are the characteristics of DEM discrete element method. After many years of research, we have a deep understanding of the theoretical framework and architecture of the discrete element method (DEM). However, when a large number of particles are calculated, the calculation results are not as expected due to the long calculation time. In view of the above problems, the members of our group put forward a solution, using GPU to replace CPU, so as to speed up the calculation speed. GPU in the performance of single core is far less than CPU, such as handling complex logic algorithm GPU is a bit inferior to CPU; However, the concurrency capability of GPUs in multiple core concurrency is much higher than that of CPU, and the ratio can reach 1 ~ 2 orders of magnitude. In order to replace CPU with GPU, Open CL.Open CL is a common parallel computing architecture, which is not limited to hardware, so it is often favored by most researchers. However, in terms of performance and accuracy, it is far less than the CUDA parallel computing architecture, for example, when dealing with double-precision values, because Open CLs can only handle single-precision, Large errors occur in the calculation results. CUDA is a parallel computing architecture proposed by NVIDIA. The architecture provides double precision operation and a lot of rich API, which improves the development efficiency and reduces the cost of implementing the device side program. Based on the existing theories and algorithms, this paper improves the particle system with Open CL by using CUDA, which meets the requirements of operation speed and accuracy. The calculation results of CUDA particle system are similar to those of Open CL particle system, and the running time of the program is not different when the same calculation parameters are used, but the simulation results are more accurate under the fine motion of particles. At the same time, according to the characteristics of the algorithm and CUDA parallel computing architecture, the CUDA particle system is optimized to further accelerate the running speed. Finally, the CUDA particle system is tested in this paper, and the correctness and operation efficiency of CUDA particle system are analyzed by the collision test of particle and particle, particle and many kinds of graph element boundary.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TB115
【相似文献】
相关期刊论文 前10条
1 侯再恩,张可村;堆积颗粒系统中颗粒级配的优化[J];高校应用数学学报A辑(中文版);2005年04期
2 张林;傅金波;邓成荣;;外力作用下二维六角密排颗粒系统中力的分布[J];湖北民族学院学报(自然科学版);2006年04期
3 王春香;陈丽梅;;颗粒系统的自组织临界性[J];科技信息;2008年31期
4 王宏达;李子军;;较大颗粒上浮的物理机制[J];物理通报;1998年12期
5 宜晨虹;慕青松;苗天德;;带有点缺陷的二维颗粒系统离散元模拟[J];物理学报;2008年06期
6 王春香;陈丽梅;;颗粒系统的广义势函数及自组织临界指数[J];齐齐哈尔大学学报;2009年02期
7 宜晨虹;蒋庆宇;慕青松;苗天德;;点缺陷对二维颗粒系统力链几何分布的影响[J];兰州大学学报(自然科学版);2009年06期
8 云中客;;钢球使沙尘飞溅[J];物理;2007年09期
9 苏军伟;顾兆林;李云;;各向同性颗粒系统数量平衡方程直接矩积分求解法的研究[J];化学反应工程与工艺;2006年04期
10 张玲;欧阳洁;;颗粒系统的多尺度耦合方法[J];工程数学学报;2006年02期
相关会议论文 前4条
1 厚美瑛;彭政;刘锐;吴耀宇;陆坤权;陈志强;;颗粒系统中的阻力形式(英文)[A];软件物质物理研讨会论文集[C];2005年
2 朱海平;余艾冰;;颗粒系统的平均法[A];数学·力学·物理学·高新技术交叉研究进展——2010(13)卷[C];2010年
3 侯再恩;张可村;;堆积颗粒系统中颗粒级配的优化模型[A];中国运筹学会第七届学术交流会论文集(中卷)[C];2004年
4 宜晨虹;幕青松;苗天德;;点缺陷对二维颗粒系统力链几何分布的影响研究[A];中国力学学会学术大会'2009论文摘要集[C];2009年
相关博士学位论文 前4条
1 蔡慧;垂直激励下环形颗粒系统中的波动与流动[D];南京大学;2015年
2 李睿;复杂颗粒系统暂态特性的研究[D];华中科技大学;2007年
3 王等明;密集颗粒系统的离散单元模型及其宏观力学行为特征的理论研究[D];兰州大学;2009年
4 陈志远;均匀驱动的复杂颗粒气体系统的动力学特征研究[D];华中科技大学;2008年
相关硕士学位论文 前10条
1 王有伟;各向异性颗粒系统对微波传播过程的影响[D];宁夏大学;2016年
2 赵晨;探索科普插图在医学研究中的应用[D];北京印刷学院;2017年
3 姜振平;基于CUDA的离散元法DEM实现方法的改进[D];吉林大学;2017年
4 张林;二维颗粒系统中力分布的理论研究[D];南京师范大学;2005年
5 苏向英;低维非均匀颗粒系统的动力学行为研究[D];华中科技大学;2006年
6 雷雅洁;非均匀颗粒系统的物理特性研究[D];华中科技大学;2004年
7 王春香;颗粒系统中双稳现象的研究[D];贵州大学;2006年
8 郑鹤鹏;轴对称颗粒系统的静应力分析[D];中南大学;2008年
9 李湘群;侧面受限颗粒系统的Janssen转向比问题研究[D];中南大学;2010年
10 田健;基于OpenCL的离散元法仿真优化软件改进研究[D];吉林大学;2015年
,本文编号:1822641
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1822641.html