当前位置:主页 > 管理论文 > 工程管理论文 >

适于无网格法的并行插值算法研究

发布时间:2021-01-09 00:29
  有限元法在模拟裂纹扩展,特大变形等过程时,会遇到网格畸变等问题,需要不断的进行网格重剖分过程,非常耗时。无网格法采用基于点的近似,不依赖于网格质量,避免了网格重剖分过程。但是无网格法发展还不成熟,计算效率和精度等问题亟待解决。本文从插值形函数的角度出发,研究了影响无网格法计算效率和计算精度的各个因素。应用多核CPU和GPU的高速并行计算技术,加速无网格法插值过程。分析了多种插值算法的各部分耗时情况,确定加速方案,给出并行算法计算流程,通过数据测试验证加速算法的可行性。对并行加速算法的加速效果进行分析,探讨相关影响因素。最终开发出了适应于无网格法的并行插值算法,并提出提高无网格法计算效率的改进方案。本文主要研究工作如下:(1)在CPU上,考虑可并行性和数据依赖性开发了RBF、MLS和Shepard插值算法的串行实现,并通过利用OpenMP接口来研发插值算法在多核CPU上的并行实现。分析在多核CPU上的并行实现,把相应并行部分代码转化为CUDA核函数,研发出插值算法在GPU上的并行实现。在GPU上的并行实现的基础上,利用Open-MP接口研发出插值算法在多块GPU上的并行实现。(2)本文在... 

【文章来源】:中国地质大学(北京)北京市 211工程院校 教育部直属院校

【文章页数】:84 页

【学位级别】:硕士

【部分图文】:

适于无网格法的并行插值算法研究


对场节点循环组装总体刚度矩阵示意图

示意图,悬臂梁模型,积分点,应变矩阵


图 5-2 对积分点循环计算子刚度矩阵示意图需要注意的是:组装总体刚度矩阵时,对场节点循环,没有数据依赖性接并行优化,但本文直接对所有积分点循环,组装总体刚度矩阵时是存赖性的,因此本文一直强调只是把积分域内积分点子刚度矩阵计算过程行优化。也就是说,本文对每个积分点的应变矩阵的计算进行了并行优个积分点的应变矩阵大小为 18×num(num 为积分点支持域内的场节,如果把所有积分点的应变矩阵都存储,就需要 n×ng3× 18 × num 大小的。由于每个积分点的应变矩阵只跟形函数的偏导数有关,为了节省内存储形函数的三个方向上的偏导数,只需要 n×ng3× 3 × num 大小的存储空在组装总体刚度矩阵时要用到每个积分点支持域内场节点的点号,因此 ng3× num 大小的存储空间来存储每个积分点支持域内场节点的点号,否体刚度矩阵需要重新为每个积分点搜索支持域内场节点。

示意图,积分点,刚度矩阵,应变矩阵


图 5-2 对积分点循环计算子刚度矩阵示意图需要注意的是:组装总体刚度矩阵时,对场节点循环,没有数据依赖性接并行优化,但本文直接对所有积分点循环,组装总体刚度矩阵时是存赖性的,因此本文一直强调只是把积分域内积分点子刚度矩阵计算过程行优化。也就是说,本文对每个积分点的应变矩阵的计算进行了并行优个积分点的应变矩阵大小为 18×num(num 为积分点支持域内的场节,如果把所有积分点的应变矩阵都存储,就需要 n×ng3× 18 × num 大小的。由于每个积分点的应变矩阵只跟形函数的偏导数有关,为了节省内存储形函数的三个方向上的偏导数,只需要 n×ng3× 3 × num 大小的存储空在组装总体刚度矩阵时要用到每个积分点支持域内场节点的点号,因此 ng3× num 大小的存储空间来存储每个积分点支持域内场节点的点号,否体刚度矩阵需要重新为每个积分点搜索支持域内场节点。


本文编号:2965610

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/2965610.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ecd82***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com