加速器工具箱的并行优化
发布时间:2021-05-09 21:43
以同步辐射实验为目标的加速器正追求更小的发射度,加速器越来越复杂,原件个数也随之增加。现代大型加速器中,加速器元件个数都以千计,因而在加速器设计及研究过程中需要大量的计算。除线性磁聚焦设计外,由于磁铁制造误差,以及其非线性原件引入的非线性问题无法给出其精确的解析解,为了优化这些非线性参数,需要做大量的粒子追踪计算。例如,在使用模拟追踪粒子运动来计算动力学孔径时,在磁铁元件中加载使用不同组别的磁场误差数据分配方式作为泰勒级数分量,通过反复检查评估制造误差在各个级数上的分布状况,以此优化可能的制造误差的分配,以期望获得尽量大的动力学孔径。在现代高能环形加速器中一般均采用强聚焦四级铁,这将引入强色品,为了校正色品采用了大量的色散六极铁。六极铁的引入带来了非线性效应,这将导致大振幅的粒子运动不稳定,影响到注入效率和束流寿命。针对不同类型环形加速器动力学孔径的限制,加速器物理学家进行了很多研究和优化。在研制一台加速器的过程中,依据粒子运动的追踪结果来确定六极铁的设置和对磁铁制造误差的要求属于十分繁重的工作。对于一台较大规模的加速器,这些粒子追踪计算需要很多的计算时间。提高计算的效率,减少计算程序...
【文章来源】:中国科学院大学(中国科学院上海应用物理研究所)上海市
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 同步辐射光源发展简史
1.2 上海光源
1.3 课题背景和意义
1.4 文章主要内容
第二章 物理背景和加速器工具箱的介绍
2.1 横向动力学
2.2 粒子追踪计算的物理背景
2.3 加速器工具箱的原理和应用
第三章 并行计算介绍以及加速器工具箱并行可能性分析
3.1 并行计算概述
3.2 并行计算机的体系结构
3.3 评价并行计算的性能
3.3.1 计算时间
3.3.2 加速比
3.3.3 性能
第四章 使用 GPU 并行加速器工具箱
4.1 CUDA 平台介绍
4.2 基于 CUDA 的并行计算环境的搭建
4.3 CUDA 的编程模型
4.4 CUDA 的线程结构
4.5 CUDA 存储模型
4.5.1 寄存器
4.5.2 局部储存器
4.5.3 共享储存器
4.5.4 全局储存器
4.6 CUDA 程序优化
4.7 使用 CUDA 并行化 AT 以及结果评估
第五章 使用 OPENMP-MPI 并行加速器工具箱
5.1 OpenMP 并行编程模型
5.2 OpenMP 的编译制导指令
5.3 OpenMP 运行时的库函数和环境变量
5.4 OpenMP 编程关键问题
5.4.1 任务的分解和循环的并行
5.4.2 并行线程的调度
5.4.3 伪共享问题
5.5 使用 OPENMP 并行化 AT
5.6 使用 OpenMP 优化 FMA 运算
5.7 在 MATLAB 中使用 MPI 进一步优化加速器工具箱
第六章 总结和展望
6.1 论文工作总结
6.2 进一步的工作
参考文献
攻读硕士学位期间发表学术论文
附录
致谢
【参考文献】:
期刊论文
[1]衍射极限储存环物理设计研究进展[J]. 焦毅,徐刚,陈森玉,秦庆,王九庆. 强激光与粒子束. 2015(04)
[2]并行谱聚类算法[J]. 白剑,杜杏虎,张国顺,刘媛. 网络安全技术与应用. 2013(11)
[3]并行化MATLAB在天在河天一河号一上号的上实的现实现[J]. 虞旭东. 航空制造技术. 2013(04)
[4]粒子群算法并行化方法研究[J]. 周云斌,章旭东. 科技创新导报. 2012(29)
[5]基于GPU的域乘法并行算法的改进研究[J]. 曾庆怡,张明武,张金霜. 新型工业化. 2012(09)
[6]多核并行计算中Cache伪共享的研究[J]. 赵富. 计算机与现代化. 2012(03)
[7]基于CUDA的超声B模式成像[J]. 夏春兰,石丹,刘东权. 计算机应用研究. 2011(06)
[8]利用CUDA实现上位机的实时目标跟踪[J]. 邓浩,杨菲,潘旭东,游安清. 信息与电子工程. 2010(03)
[9]Shanghai20Synchrotron20Radiation20Facility[J]. JIANG MianHeng1, YANG Xiong2, XU HongJie3, ZHAO ZhenTang3 & DING Hao4 1 Chinese Academy of Sciences, Beijing 100864, China; 2 Shanghai Municipal Government, Shanghai 200003, China; 3 Shanghai Institute of Applied Physics, Chinese Academy of Sciences, Shanghai 201800, China; 4 Shanghai Urban Construction & Communications, Shanghai 200003, China. Chinese Science Bulletin. 2009(22)
[10]基于集群技术构建聚变研究高性能计算系统[J]. 潘卫,陈燎原,李永革,张锦华,潘莉,夏凡. 计算机应用. 2009(08)
博士论文
[1]基于并行计算的数据流处理方法研究[D]. 周勇.大连理工大学 2013
[2]高超声速多场耦合及其GPU计算加速技术研究[D]. 张兵.南京航空航天大学 2011
硕士论文
[1]基于OpenMP的并行混合PVS算法及其应用[D]. 邹竞.湖南大学 2012
[2]可重构天线技术在无源测向中的应用研究[D]. 谭冠南.江苏科技大学 2012
[3]基于CUDA的动载荷识别问题的并行算法研究[D]. 侯有政.南京航空航天大学 2012
[4]基于多核计算的分类数据挖掘算法研究[D]. 刘闯.南京航空航天大学 2012
[5]移动对象索引方法研究[D]. 朱占宇.南京航空航天大学 2010
本文编号:3178075
【文章来源】:中国科学院大学(中国科学院上海应用物理研究所)上海市
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 同步辐射光源发展简史
1.2 上海光源
1.3 课题背景和意义
1.4 文章主要内容
第二章 物理背景和加速器工具箱的介绍
2.1 横向动力学
2.2 粒子追踪计算的物理背景
2.3 加速器工具箱的原理和应用
第三章 并行计算介绍以及加速器工具箱并行可能性分析
3.1 并行计算概述
3.2 并行计算机的体系结构
3.3 评价并行计算的性能
3.3.1 计算时间
3.3.2 加速比
3.3.3 性能
第四章 使用 GPU 并行加速器工具箱
4.1 CUDA 平台介绍
4.2 基于 CUDA 的并行计算环境的搭建
4.3 CUDA 的编程模型
4.4 CUDA 的线程结构
4.5 CUDA 存储模型
4.5.1 寄存器
4.5.2 局部储存器
4.5.3 共享储存器
4.5.4 全局储存器
4.6 CUDA 程序优化
4.7 使用 CUDA 并行化 AT 以及结果评估
第五章 使用 OPENMP-MPI 并行加速器工具箱
5.1 OpenMP 并行编程模型
5.2 OpenMP 的编译制导指令
5.3 OpenMP 运行时的库函数和环境变量
5.4 OpenMP 编程关键问题
5.4.1 任务的分解和循环的并行
5.4.2 并行线程的调度
5.4.3 伪共享问题
5.5 使用 OPENMP 并行化 AT
5.6 使用 OpenMP 优化 FMA 运算
5.7 在 MATLAB 中使用 MPI 进一步优化加速器工具箱
第六章 总结和展望
6.1 论文工作总结
6.2 进一步的工作
参考文献
攻读硕士学位期间发表学术论文
附录
致谢
【参考文献】:
期刊论文
[1]衍射极限储存环物理设计研究进展[J]. 焦毅,徐刚,陈森玉,秦庆,王九庆. 强激光与粒子束. 2015(04)
[2]并行谱聚类算法[J]. 白剑,杜杏虎,张国顺,刘媛. 网络安全技术与应用. 2013(11)
[3]并行化MATLAB在天在河天一河号一上号的上实的现实现[J]. 虞旭东. 航空制造技术. 2013(04)
[4]粒子群算法并行化方法研究[J]. 周云斌,章旭东. 科技创新导报. 2012(29)
[5]基于GPU的域乘法并行算法的改进研究[J]. 曾庆怡,张明武,张金霜. 新型工业化. 2012(09)
[6]多核并行计算中Cache伪共享的研究[J]. 赵富. 计算机与现代化. 2012(03)
[7]基于CUDA的超声B模式成像[J]. 夏春兰,石丹,刘东权. 计算机应用研究. 2011(06)
[8]利用CUDA实现上位机的实时目标跟踪[J]. 邓浩,杨菲,潘旭东,游安清. 信息与电子工程. 2010(03)
[9]Shanghai20Synchrotron20Radiation20Facility[J]. JIANG MianHeng1, YANG Xiong2, XU HongJie3, ZHAO ZhenTang3 & DING Hao4 1 Chinese Academy of Sciences, Beijing 100864, China; 2 Shanghai Municipal Government, Shanghai 200003, China; 3 Shanghai Institute of Applied Physics, Chinese Academy of Sciences, Shanghai 201800, China; 4 Shanghai Urban Construction & Communications, Shanghai 200003, China. Chinese Science Bulletin. 2009(22)
[10]基于集群技术构建聚变研究高性能计算系统[J]. 潘卫,陈燎原,李永革,张锦华,潘莉,夏凡. 计算机应用. 2009(08)
博士论文
[1]基于并行计算的数据流处理方法研究[D]. 周勇.大连理工大学 2013
[2]高超声速多场耦合及其GPU计算加速技术研究[D]. 张兵.南京航空航天大学 2011
硕士论文
[1]基于OpenMP的并行混合PVS算法及其应用[D]. 邹竞.湖南大学 2012
[2]可重构天线技术在无源测向中的应用研究[D]. 谭冠南.江苏科技大学 2012
[3]基于CUDA的动载荷识别问题的并行算法研究[D]. 侯有政.南京航空航天大学 2012
[4]基于多核计算的分类数据挖掘算法研究[D]. 刘闯.南京航空航天大学 2012
[5]移动对象索引方法研究[D]. 朱占宇.南京航空航天大学 2010
本文编号:3178075
本文链接:https://www.wllwen.com/projectlw/hkxlw/3178075.html