当前位置:主页 > 科技论文 > 计算机论文 >

基于CUDA的金刚石膜生长仿真的研究与实现

发布时间:2020-06-02 23:44
【摘要】:并行计算将成为计算机发展的一种趋势,因为传统的CPU串行计算已不能满足发展的要求。特别是在科学计算领域,许多计算都需要大量的计算。在以往的研究中,大部分的计算都需要在高配置的小型机或计算机集群上才能完成。但是这两者的使用在时间和经济上都需要巨大的开销,一些研究者们根本没有条件或机会使用这种设备,从而导致科学研究中许多复杂问题难以解决。 图形处理器(GPU)的出现为解决上述问题提供了可能。GPU具有强大的浮点数计算能力和并行计算能力,较CPU而言更适合大数据量的浮点运算。在GPU平台上进行金刚石膜生长仿真,不仅能够提高效率,还能有效减少经济成本上的投入。统一设备计算架构(CUDA)是一种基于GPU的通用并行计算架构,这种架构使GPU能够解决复杂的计算问题。它采用了比较容易掌握的类C语言进行开发,无需重新学习新语言的语法。编写出的程序就能在支持CUDA的处理器上以超高性能运行。本文以CUDA平台为基础,对金刚石膜生长仿真进行了研究。 本文首先介绍了CUDA技术,包括CUDA的软硬件架构、程序结构、线程结构以及存储器模型等。随后介绍了金刚石膜生长仿真的两种方法—动力学蒙特卡罗(KMC)和分子动力学(MD)—的基本原理,并在CPU和CUDA平台上分别对其进行实现。针对KMC的特点,本文以增加数据来对全局存储器的访问进行优化,通过使用常数存储器来增加程序的运行效率,并对grid和block的维度进行合理的设计从而提高了GPU的计算效率。MD方法中分子间作用力的计算占总计算量的比重很大,原始计算模型不能完全发挥GPU的特性。针对这个问题,本文对该模型进行了改进,使用共享存储器对原程序进行优化。由于共享存储器的容量有限,本文采用迭代的方式来读入网格数据,并用叠加的方式计算分子间作用力。最后通过实验对三种实现方法进行对比。结果显示,CUDA在最好的情况下能得到75倍的加速效果。
【学位授予单位】:东北大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TQ164;TP338.6

【参考文献】

相关期刊论文 前10条

1 安希忠,张禹,刘国权,秦湘阁,王辅忠,刘胜新;CVD金刚石膜{100}取向生长的原子尺度仿真[J];北京科技大学学报;2002年02期

2 安希忠,张禹,刘国权,秦湘阁,王辅忠,刘胜新;CVD金刚石膜{100}取向在改进化学反应模型下生长的原子尺度模拟[J];稀有金属材料与工程;2002年05期

3 韩志伟;刘志刚;鲁晓帆;周登登;;基于CUDA的高速并行小波算法及其在电力系统谐波分析中的应用[J];电力自动化设备;2010年01期

4 张慧滔;于平;胡修炎;张朋;;利用GPU实现单层螺旋CT的三维图像重建[J];电子学报;2011年01期

5 申海兰;赵靖松;;分子动力学模拟方法概述[J];装备制造技术;2007年10期

6 吴子若;程鑫彬;王占山;;动力学晶格蒙特卡洛方法模拟Cu薄膜生长[J];光子学报;2010年01期

7 宋殿友;赵红东;胡和智;张凡;;薄膜生长的Monte Carlo模拟[J];河北工业大学学报;2006年02期

8 陈飞国;葛蔚;李静海;;复杂多相流动分子动力学模拟在GPU上的实现[J];中国科学(B辑:化学);2008年12期

9 林江;唐敏;童若锋;;GPU加速的生物序列比对[J];计算机辅助设计与图形学学报;2010年03期

10 苏畅;付忠良;谭雨辰;;一种在GPU上高精度大型矩阵快速运算的实现[J];计算机应用;2009年04期

相关重要报纸文章 前1条

1 本报特约撰稿 吴康迪;[N];计算机世界;2009年

相关硕士学位论文 前1条

1 刘美林;择优取向生长的ZnO薄膜的制备及氧化物薄膜生长过程的分子动力学模拟[D];东北大学 ;2009年



本文编号:2693940

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2693940.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1b0e6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com