基于CUDA的有限元矩阵并行装配算法研究

发布时间：2021-07-14 21:11

　　构建航天飞行器的结构有限元模型是准确模拟飞行仿真、完成飞行器在轨飞行阶段结构故障监测和诊断的基础。采用细长体飞行器简化梁模型,提出新的基于CUDA（Compute Unified Device Architecture）的有限元单元刚度矩阵生成和总刚度矩阵组装算法。依据梁单元矩阵的对称性,结合GPU硬件架构提出并行生成算法并进行改进。为有效减少装配时间,在装配过程中采用着色算法,提出了基于GPU（Graphics Processing Unit）共享内存的非零项组装策略,通过在不同计算平台下算例对比,验证了新算法的快速性。数值算例表明,本文算法的求解效率较高,针对一定计算规模内的模型可满足快速计算与诊断的实时性要求。

【文章来源】：计算力学学报. 2020,37(03)北大核心CSCD

【文章页数】：9 页

【部分图文】：

2维单元着色

数据,单元,内存,格式

该策略采用一个线程(或线程块)计算一个有限单元数据,为避免竞态条件,先将单元数据写入全局显存以便稍后的系统方程构建。受GPU硬件架构的限制,全局显存内的单元数据在构造系统方程时无法执行全局的同步操作,故组装系统方程和计算单元特征矩阵需执行两个不同的核函数。鉴于篇幅,针对全局显存的非零项组装策略仅介绍单元特征矩阵的核函数并行计算部分。在一般情况下,因单元内节点编号并不连续,而节点结构体数组通常是按编号排序的,故通常在读取该部分数据时无法实现合并访问。在此不妨设置一个节点数据矩阵Ce,其中,Ce(e,a)是单元e的本地节点a的节点数据。如果节点数据不发生变化,则可实现加速;若节点数据发生变化,则Ce需在每个时步进行更新。与上述算法对比,本策略中Ce刷新需要额外的全局显存带宽,通常会导致计算速度更慢。故可将单元组织为若干个子集,其中子集内的单元可以共享节点数据,使得经由全局显存的数据传输总量通过预取数据实现线程块内的数据共享。在此,不妨假定εk是第k个线程块的单元集合,计算节点集合Nk的公式为

矩阵图,单元,主元,节点

en=3的列主元预处理块单元矩阵EI

【参考文献】：
期刊论文
[1]基于FTM算法的GPU加速[J]. 曾良,杜煜昊,张莹,胡昱,洪瑶,陈虎.  计算力学学报. 2017(04)
[2]基于GPU并行计算的浅水波运动数值模拟[J]. 许栋,徐彬,David PAyet,白玉川,及春宁.  计算力学学报. 2016(01)
[3]考虑气动—推进—弹性耦合的高超声速飞行器面向控制建模与分析[J]. 张希彬,宗群,曾凡琳.  宇航学报. 2014(05)
[4]高超声速飞行器刚体/弹性体耦合动力学建模[J]. 李惠峰,肖进,张冉.  北京航空航天大学学报. 2012(02)
[5]大规模有限元系统的GPU加速计算研究[J]. 刘小虎,胡耀国,符伟.  计算力学学报. 2012(01)
[6]弹性变形对大长细比弹箭气动特性的影响研究[J]. 刘万刚,张伟伟,蒋胜矩,赵志军,朱红星.  弹箭与制导学报. 2010(02)
[7]高超声速飞行器气动弹性力学研究综述[J]. 杨超,许赟,谢长川.  航空学报. 2010(01)
[8]弹性飞行器气动伺服弹性耦合动力学仿真[J]. 杨炳渊,樊则文.  宇航学报. 2009(01)
[9]图的所有可能的K着色并行算法[J]. 殷小玲.  池州师专学报. 2006(03)
[10]求图着色问题的新算法[J]. 陈卫东.  微计算机应用. 2004(04)

博士论文
[1]大型捆绑火箭姿态控制系统的建模、设计与分析[D]. 李家文.国防科学技术大学 2011

本文编号：3284901

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/hangkongsky/3284901.html

上一篇：基于局部异常因子的近地全天时星图小波去噪
下一篇：空间大型结构体组装单元及装配性能研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|