基于太湖之光的可扩展分子模拟算法研究与实现
发布时间:2023-05-28 12:26
在对原子和分子物理运动的各种研究中,分子动力学(MD)模拟是模拟和研究真实分子运动的常用工具。然而,它在性能,功耗,电力和运行时间方面仍存在严重缺陷。因此,一旦模拟规模扩大并且计算需求持续增长,则会导致性能和能源使用方面的实质性成本骤增。在本文中,为了解决上述问题,在具有异构多核处理器的神威太湖之光超级计算机上,我们优化了当前的算法实现并提出了一种新颖的分子动力学实现。神威太湖之光是一款由中国完全独立设计和开发的超级计算机,拥有丰富的自定义集成方法和全新的多核处理器SW26010。神威太湖之光的计算能力主要由国产多核SW26010处理器支持,且不同于其他现有的异构超级计算机。神威太湖之光是一款异构超级计算机,其峰值性能超过100PFLOPS,在全球排名第一。首先,我们提出了一种基于粒子簇的新算法,以适应神威太湖之光SW26010芯片的特殊体系结构。然后,逐步实现分子动力学模拟仿真优化的三步操作:在SW26010上对分子动力学模拟的并行化扩展,存储器内存访问优化和向量化通信优化。通过在“神威太湖之光”上对分子动力学的扩展,我们不仅证明了其代码的可适用性,可扩展性及其可并行性,更是为其他科...
【文章页数】:59 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究目的与意义
1.2 论文主要研究贡献
1.3 国内外研究现状
1.4 论文组织结构
第2章 系统架构和模型
2.1 系统架构
2.2 SW26010处理器
2.3 高速互连网络
2.4 辅助互连网络
2.5 本章小结
第3章 基于太湖之光的可行性分析
3.1 分子动力学
3.2 太湖之光特殊阵列模式(集合模式)
3.3 软件对DMA模式的需求情况
3.4 本章小结
第4章 分子动力学算法构建及优化
4.1 邻居列表的构建
4.2 力计算
4.3 粒子簇算法
4.4 本章小结
第5章 分子动力学模拟仿真并行扩展及其优化
5.1 代码在CPE集群上的移植
5.2 从核并行化
5.3 访存优化
5.4 手动预取
5.5 向量化操作
5.6 本章小结
第6章 实验结果分析
6.1 实验设置
6.2 性能评估
6.3 多节点间性能
6.4 本章小结
结论
参考文献
致谢
附录 A 发表论文和参加科研情况说明
本文编号:3824586
【文章页数】:59 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究目的与意义
1.2 论文主要研究贡献
1.3 国内外研究现状
1.4 论文组织结构
第2章 系统架构和模型
2.1 系统架构
2.2 SW26010处理器
2.3 高速互连网络
2.4 辅助互连网络
2.5 本章小结
第3章 基于太湖之光的可行性分析
3.1 分子动力学
3.2 太湖之光特殊阵列模式(集合模式)
3.3 软件对DMA模式的需求情况
3.4 本章小结
第4章 分子动力学算法构建及优化
4.1 邻居列表的构建
4.2 力计算
4.3 粒子簇算法
4.4 本章小结
第5章 分子动力学模拟仿真并行扩展及其优化
5.1 代码在CPE集群上的移植
5.2 从核并行化
5.3 访存优化
5.4 手动预取
5.5 向量化操作
5.6 本章小结
第6章 实验结果分析
6.1 实验设置
6.2 性能评估
6.3 多节点间性能
6.4 本章小结
结论
参考文献
致谢
附录 A 发表论文和参加科研情况说明
本文编号:3824586
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3824586.html