FPGA加速蒙特卡罗计算关键技术的研究与应用
本文选题:蒙特卡罗计算 切入点:FPGA加速 出处:《国防科学技术大学》2013年博士论文 论文类型:学位论文
【摘要】:蒙特卡罗模拟是一种广泛应用于分子物理学、金融工程学和生物医学等领域求解科学计算问题的重要方法。随着科学技术的发展,运用蒙特卡罗方法解决实际问题的复杂性不断增大,导致对计算设备运算能力的需求也在不断地增强。开发新的计算模式以实现对蒙特卡罗模拟进行加速已成为现代科学计算急需解决的重要问题。近年来,FPGA芯片以其可重构、支持细粒度并行、高性能、低功耗等优势,已成为理想的计算加速平台。然而,FPGA加速蒙特卡罗计算还面临着算法特征多样性、算法并行结构设计困难、硬件结构优化复杂等挑战。已有的蒙特卡罗加速结构存在消耗FPGA资源过大、并行计算结构具有局限性、计算结构缺乏通用性等缺陷。为了应对这些问题与挑战,本文对蒙特卡罗计算的FPGA加速技术进行了深入地研究。集中解决了实现加速的几项关键技术,并在此基础上实现了对金融衍生产品定价模型的计算加速。本文的主要工作和创新点如下:1.提出了基于FPGA的长周期均匀分布随机数加速结构。本文在学术界首次提出基于WELL算法的均匀分布随机数FPGA加速结构。该结构能获得1拍产生1个随机数的吞吐率,并具有高质量、长周期、高性能、低硬件消耗等特点。本文针对WELL算法的访存特性,提出了一种6读/2写多端口RAM结构。该RAM采用Register-BRAMs混合架构,在充分利用FPGA内嵌BRAM存储器特性的基础上,仅需消耗1个32位寄存器和2个BRAMs即可支持6读/2写的并行访问,打破了BRAM最多支持双端口读写的限制,是整个系统获得目标吞吐率的关键部件。实验结果表明,本文所设计的随机数加速结构优于相关工作和通用处理器的软件实现。2.设计并实现了基于FPGA的浮点转定点自动位宽优化软件工具SATRANS。SATRANS能够将描述算法的浮点程序转换成定点程序并进行自动位宽优化。采用模拟退火算法作为位宽搜索引擎,相对于传统的贪心搜索算法能够获得更加优化的搜索结果。并能够获得一系列满足精度要求的位宽组合,使得设计者能够在性能、面积开销等设计因素间权衡,以选择最合适的结果应用到系统设计中。为了弥补模拟退火搜索迭代次数多,速度慢的缺点,SATRANS以C语言的无符号长整型表示定点操作数,并用相应的加减乘、移位、掩码等基本操作来模拟定点运算。相对于gfix,fi等定点程序包获得了巨大的性能提升。将SATRANS应用到IIR系统、高斯随机数发生器以及金融工程加速系统的设计中,取得了较好的效果。3.提出了基于FPGA的长周期高斯分布随机数发生框架。本文在充分研究各种高斯随机数生成算法共性的基础上,提出了基于FPGA的高斯随机数发生器的通用设计流程,并基于该设计流程对Box Muller和Monty Python两种高斯随机数生成算法进行了FPGA设计。对于Box Muller算法,采用分段多项式拟合法对基本函数运算进行硬件拟合,并采用SATRANS对结构进行位宽优化。实验结果表明,该结构能获得1拍产生2个随机数的吞吐率,相对于通用处理获得了12.5倍的性能提升,在周期、性能/面积消耗比等指标上均优于相关工作。在性能和面积消耗上均优于浮点实现。对于Monty Python算法,定制了一套高效的四段并行结构,能将处理高斯随机数PDF中主路径的全流水部件和处理Tail区域的专用迭代部件并行执行,有效地隐藏了循环迭代对高斯系统性能的影响。实验结果表明,该结构能获得接近1拍产生1个随机数的吞吐率,相对于通用处理器获得了24.8倍的性能提升,在周期和性能上优于相关工作。在性能和面积消耗上均要优于相应的浮点实现。4.提出了软硬件协同的并行均匀分布随机数生成框架。其中软件部分基于Fast Jump Ahead技术产生各子路随机数发生器的初始状态,以保证各子序列相互独立。在软件的支持下,硬件部分仅需简单复制单随机数发生器即可实现。为了提高软件部分的计算效率,本文提出了一种高效的矩阵特征多项式计算算法,能够快速计算出任意F2-Linear随机数算法状态矩阵的特征多项式。实验结果表明,该并行随机数发生框架能够产生任意路相互独立的均匀分布随机数序列,并且吞吐率和资源消耗均随着并行度的增加呈线性增长。以WELL19937算法为例在Virtex 5上实现并行框架,最多能集成149个随机数发生器。相对于同等工艺的CPU和GPU,吞吐率分别提高了9.8倍和2.5倍,效能(吞吐率/功耗)分别获得了194.9倍和21.1倍的提升。所产生的并行随机数序列通过了标准统计测试集对其相关性的检测,并成功应用到一个真实的蒙特卡罗模拟环境:π的蒙特卡罗模拟。本文还基于并行均匀分布随机数发生框架,提出了并行高斯分布随机数生成框架。该框架同样能够产生任意路相互独立的高斯分布随机数序列,具有很好的可扩展性,且在性能和效能上均优于同等工艺的CPU和GPU实现。5.提出了金融衍生产品定价模型的并行FPGA加速结构。本文在前几项研究工作的基础上,首次提出了基于Drageseth模型的并行CDS(信用违约互换)加速结构。在该并行结构中对软硬件任务划分,多计算核的任务划分,多核的协同计算以及计算结果的整合等关键技术进行了详细的定义。并通过通信延时隐藏等技术提高整个系统的性能/面积消耗比。实验结果表明,该并行结构能产生精确的计算结果,具有很好的可扩展性。相对于通用处理器的软件实现获得了约358倍的性能提升。
[Abstract]:......
【学位授予单位】:国防科学技术大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:O242.2;TN791
【共引文献】
相关期刊论文 前10条
1 洪俊;芮筱亭;刘军;陈涛;;散粒体发射药床碰撞挤压过程三维数值模拟研究[J];兵工学报;2007年03期
2 王海东;张海;;晶粒生长的蒙特卡罗模拟研究进展[J];材料导报;2007年02期
3 代志力;陈浩;黎明;;基于MCNP对CT系统中探测器材料性能的研究[J];CT理论与应用研究;2011年01期
4 杨乃恒,王继常,刘玉岱;蒙特卡罗法计算涡轮分子泵叶列的传输几率[J];东北工学院学报;1984年01期
5 贾文宝;王仲奇;张本爱;;随机抽样中的Alias算法及其改进[J];东北师大学报(自然科学版);2012年01期
6 刘德坤;张宏宇;张丽红;谷德山;卜香云;董焕;;用MCNP模拟中子煤质检测时外水增加对低位热值的影响[J];东北师大学报(自然科学版);2012年02期
7 姜世平;芮筱亭;洪俊;王国平;徐浩;;发射药床自然堆积模拟[J];弹道学报;2011年02期
8 姜璐;朱海;李松;;水下目标反激光雷达探测隐蔽深度的蒙特卡罗计算[J];弹箭与制导学报;2005年S6期
9 姜璐;朱海;于运治;;基于蒙特卡罗方法的水下目标光学隐蔽性影响因素分析[J];弹箭与制导学报;2006年04期
10 高显忠;赵伟;侯中喜;;粒子滤波改进算法研究[J];弹箭与制导学报;2009年03期
相关会议论文 前7条
1 章法强;杨建伦;李正宏;陈法新;;数值模拟高能中子照相[A];2006全国核材料学术交流会论文集[C];2006年
2 孙业胜;陈道南;关焯;;起重机减速器的可靠度计算[A];中国机械工程学会物料搬运专业学会第三届年会论文集[C];1988年
3 邹树梁;王建;;钨和铅作为γ射线屏蔽材料的性能对比研究[A];中国核科学技术进展报告(第二卷)——中国核学会2011年学术年会论文集第5册(辐射防护分卷、核化工分卷)[C];2011年
4 窦玉玲;王国保;张国光;丰树强;赵潇;王新光;;小型D-T中子发生器慢化体的蒙特卡罗模拟[A];中国核科学技术进展报告(第二卷)——中国核学会2011年学术年会论文集第9册(核医学分卷、核技术工业应用分卷)[C];2011年
5 许小明;贾向军;甘霖;;含钚物料中子多重性测量技术研究[A];中国核学会核化工分会成立三十周年庆祝大会暨全国核化工学术交流年会会议论文集[C];2010年
6 唐桢;周四春;廖芹;李高峰;魏威;;伽马射线辐射屏蔽效果实验的应用研究[A];辐射防护分会2012年学术年会论文集[C];2012年
7 李虹轶;林源根;许伟;吴昌莉;;提高MCNP γ能谱模拟精度方法分析[A];中国核科学技术进展报告(第三卷)——中国核学会2013年学术年会论文集第7册(核电子学与核探测技术分卷、脉冲功率技术及其应用分卷、核聚变与等离子体物理分卷)[C];2013年
相关博士学位论文 前10条
1 师学明;聚变裂变混合能源堆包层中子学概念研究[D];中国工程物理研究院;2010年
2 马丽珍;自由空间量子通信中偏振光子传输和操控的理论与模拟研究[D];中国海洋大学;2010年
3 刘洋;基于可视中国人体素数据的内辐射剂量研究[D];华中科技大学;2011年
4 陈波;BaFX成像板的辐射探测特性及其在总α测量中的应用[D];复旦大学;2011年
5 申凤君;X射线荧光测井关键技术研究[D];成都理工大学;2011年
6 李吉功;室外时变气流环境下机器人气味源定位[D];天津大学;2010年
7 周日峰;高能X射线工业CT气固混合型电子倍增辐射探测器探索研究[D];重庆大学;2011年
8 谷晓忱;并行蒙特卡罗计算硬件加速器的关键技术研究[D];国防科学技术大学;2010年
9 龚春叶;面向异构体系结构的粒子输运并行算法研究[D];国防科学技术大学;2011年
10 尹丽菊;基于GM-APD的光子计数成像技术研究[D];南京理工大学;2012年
相关硕士学位论文 前10条
1 余波;惯性约束聚变的中子半影成像诊断系统和非线性重建方法研究[D];中国工程物理研究院;2010年
2 张绚;双轴闪光照相系统中的散射问题研究[D];中国工程物理研究院;2010年
3 杨佳音;反应堆中子分布与屏蔽设计研究[D];哈尔滨工程大学;2010年
4 史鹏;偏振光子的大气传输及光子与腔—量子点的相互作用[D];中国海洋大学;2010年
5 胡跃波;胶州湾溢油动态预报模式及可视化研究[D];中国海洋大学;2010年
6 刘文静;粒子滤波关键技术及其应用研究[D];河南理工大学;2010年
7 马维云;钛酸锶钡铁电陶瓷的电性能研究及其薄膜制备[D];昆明理工大学;2010年
8 答元;MOS器件电离损伤的蒙特卡罗模拟研究[D];西安工业大学;2011年
9 向张衡;受限于同心圆柱套筒间的半刚性高分子链构象行为[D];浙江大学;2011年
10 杨海芳;质子打薄靶的角度和能量歧离的蒙特卡罗模拟[D];吉林大学;2011年
,本文编号:1634831
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1634831.html