当前位置:主页 > 科技论文 > 计算机论文 >

EFG法及其拓扑优化的GPU并行计算研究

发布时间:2017-09-29 20:33

  本文关键词:EFG法及其拓扑优化的GPU并行计算研究


  更多相关文章: EFG法 拓扑优化 GPU CUDA 并行加速 PCG法 交叉节点对


【摘要】:EFG(Element-Free Galerkin)法不仅摆脱了网格的束缚,而且具有计算稳定性好、收敛速度快以及精度高等优点,另EFG法拓扑优化可有效解决有限元法拓扑优化中出现的重构网格等问题,并可有效消除棋盘格现象,所以EFG法及其拓扑优化吸引了越来越多学者们的关注。不过由于EFG法具有计算效率低的缺点,严重束缚了它们在大规模问题中的研究及应用。与此同时,随着GPU(Graphic Processing Unit)并行计算的迅速发展,其现已被广泛应用于众多领域。因此,本文针对EFG法计算效率低和耗时长等缺点,开展EFG法及其拓扑优化的GPU并行计算研究,主要内容有:(1)三维EFG结构分析方法的研究及应用。引入三角形单元(2D)或四面体单元(3D)代替EFG法传统算法中的四边形单元(2D)或六面体单元(3D)作为背景积分网格,并采用Hammer积分取代传统算法中的Gauss积分实现EFG中的积分计算,推导出相关公式且通过数值算例验证了该方案的可行性。(2)EFG法的GPU并行计算研究。首先基于交叉节点对思想,提出了一种总体刚度矩阵、总体惩罚刚度矩阵和预处理矩阵的联合组装方案及其GPU并行算法;其次提出了一种耦合GPU和PCG(Preconditioned Conjugate Gradient)法的EFG法加速算法,并给出了该加速算法的相关公式推导过程及流程图;而后通过数值算例,研究了PCG法求解EFG法总体离散控制方程的收敛速度及计算耗时,并探讨了求解域离散节点数及GPU线程块大小对加速比的影响。(3)EFG法拓扑优化的GPU并行计算研究。首先基于交叉节点对思想,提出了一种目标函数灵敏度的并行算法,并结合CUDA架构(Compute Unified Device Architecture)设计了目标函数灵敏度和OC(Optimization Criterion)法的GPU并行算法;然后提出了一种EFG法拓扑优化的GPU并行算法并给出了该算法流程图。通过数值算例验证了上述算法的可行性及有效性,获得了24倍的加速比,且探讨了设计域离散节点数对加速比及优化结果的影响。本文利用GPU并行计算显著缩短了EFG法及其拓扑优化的计算时间,提高了其计算效率,该研究对EFG法及其拓扑优化应用于工程问题具有重要的理论参考价值和工程实际意义。
【关键词】:EFG法 拓扑优化 GPU CUDA 并行加速 PCG法 交叉节点对
【学位授予单位】:湘潭大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP338.6
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 主要符号对照表9-10
  • 第1章 绪论10-17
  • 1.1 研究背景及意义10-11
  • 1.2 GPU并行计算研究现状11-12
  • 1.3 EFG法及其拓扑优化研究现状12-15
  • 1.4 主要研究内容15-17
  • 第2章 EFG法算法改进及CUDA架构17-29
  • 2.1 EFG法17-18
  • 2.2 算法改进18-24
  • 2.2.0 积分方案18-20
  • 2.2.1 节点影响域计算20-21
  • 2.2.2 局部搜索格子法21-23
  • 2.2.3 稀疏矩阵的压缩存储23-24
  • 2.3 CUDA架构24-28
  • 2.3.1 编程模型24-25
  • 2.3.2 线程结构25-26
  • 2.3.3 存储器模型26-27
  • 2.3.4 程序优化27-28
  • 2.4 本章小结28-29
  • 第3章 EFG法的GPU并行计算研究29-46
  • 3.1 系数矩阵组装29-32
  • 3.1.1 逐节点对法29-31
  • 3.1.2 总体惩罚刚度矩阵31-32
  • 3.1.3 系数矩阵的GPU并行组装32
  • 3.2 总体离散系统方程求解32-37
  • 3.2.1 CG法33-34
  • 3.2.2 PCG法34-37
  • 3.3 计算流程37
  • 3.4 数值算例37-42
  • 3.5 PCG法求解EFG法42-43
  • 3.6 加速比及其影响因素43-44
  • 3.7 本章小结44-46
  • 第4章 EFG法拓扑优化的GPU并行计算研究46-63
  • 4.1 EFG法拓扑优化46-50
  • 4.1.1 数学模型46-47
  • 4.1.2 0C准则47-49
  • 4.1.3 灵敏度分析49-50
  • 4.2 目标函数灵敏度的并行算法50-54
  • 4.2.1 算法改进50-52
  • 4.2.2 GPU并行算法52-54
  • 4.3 OC法的GPU并行算法54-55
  • 4.4 并行流程55-56
  • 4.5 数值算例56-59
  • 4.6 节点数对加速比的影响59
  • 4.7 节点数对优化结果的影响59-61
  • 4.8 本章小结61-63
  • 总结与展望63-65
  • 参考文献65-71
  • 致谢71-72
  • 附录(攻读硕士学位期间已发表论文及参与项目)72

【参考文献】

中国期刊全文数据库 前1条

1 蔡新;李洪煊;武颖利;朱杰;;工程结构优化设计研究进展[J];河海大学学报(自然科学版);2011年03期



本文编号:944119

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/944119.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b54a1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com