当前位置:主页 > 科技论文 > 计算机论文 >

面向众核处理器的大整数乘法研究

发布时间:2021-03-19 21:45
  算数运算一直是人类科学发展过程中非常重要的研究领域,很多科学问题的解决依赖于准确、快速的算术运算。在计算机上,算数运算是实现各种应用的基础,尤其大整数的乘法运算在密码算法、科学计算中有着广泛的应用。目前,计算机体系结构开始向多核、众核结构发展,众核处理器已经开始在高性能计算等领域普遍使用。研究如何在众核处理器上高效实现大整数乘法,对发挥现代众核处理器性能优势,求解更大规模问题具有重要意义。基于计算机体系结构的发展变化,以及现实应用中对高效大整数乘法需求不断的提升,本文对众核处理上的大整数乘法进行了研究,主要工作和创新有:(1)对笔算乘法和Comba乘法等基本乘法算法的并行性进行研究,并提出多种实现高效并行Comba乘法的改进方法,以及给出了在SW26010众核处理器实现并行Comba乘法的具体方法。(2)对Karatsuba乘法等分治类乘法的并行性进行研究,并提出面向众核处理器的Karatsuba乘法的改进方法,以及研究了在SW26010众核处理器实现并行Karatsuba乘法的方法。(3)对FFT乘法进行分析与研究,提出在SW26010众核处理器实现高效并行FFT乘法的方法,实现过程... 

【文章来源】:郑州大学河南省 211工程院校

【文章页数】:71 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 引言
    1.1 课题背景
    1.2 研究意义
    1.3 论文主要工作
    1.4 论文结构
2 研究基础
    2.1 基本概念
    2.2 数学基础
        2.2.1 多项式表示
        2.2.2 多项式乘法
    2.3 大整数乘法
        2.3.1 基本乘法
        2.3.2 分治乘法
        2.3.3 FFT乘法
    2.4 大整数运算库
    2.5 SW26010众核处理器
    2.6 本章小结
3 Comba乘法的改进及众核并行化
    3.1 基本乘法分析
        3.1.1 笔算乘法分析
        3.1.2 Comba乘法分析
    3.2 Comba乘法改进
        3.2.1 任务划分策略
        3.2.2 改进的Comba算法
    3.3 并行Comba算法在SW众核处理器上的实现
    3.4 本章小结
4 Karatsuba乘法的改进及众核并行化
    4.1 分治乘法
        4.1.1 Karatsuba乘法
        4.1.2 Toom-Cook乘法
    4.2 Karatsuba乘法分析
    4.3 Karatsuba乘法的改进
    4.4 改进Karatsuba乘法的并行实现
    4.5 本章小结
5 FFT乘法的众核并行化
    5.1 快速傅里叶变换
    5.2 FFT乘法原理
    5.3 FFT乘法的众核并行化实现
        5.3.1 FFT乘法众核并行化实现思路
        5.3.2 复数运算的向量化
        5.3.3 寄存器通信
    5.4 本章小结
6 大整数乘法系统构造及测试
    6.1 乘法算法测试与分析
    6.2 面向SW26010的大整数乘法系统
    6.3 本章小结
7 结论
    7.1 工作总结
    7.2 展望与计划
参考文献
个人简历及发表论文情况
致谢


【参考文献】:
期刊论文
[1]基于Intel MIC架构的3D有限差分算法优化[J]. 郝鑫,郭绍忠.  计算机科学. 2017(05)
[2]以深度学习为目标,NVIDIA发布首款Volta架构GPU[J]. 寒意.  华东科技. 2017(05)
[3]大整数Comba和Karatsuba乘法的多核并行化研究[J]. 蒋丽娟,刘芳芳,赵玉文,杨超,蔡颖.  计算机系统应用. 2016(11)
[4]高性能计算的发展[J]. 臧大伟,曹政,孙凝晖.  科技导报. 2016(14)
[5]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG.  Science China(Information Sciences). 2016(07)
[6]一种面向高性能计算的自主众核处理器结构[J]. 郑方,许勇,李宏亮,谢向辉,陈左宁.  中国科学:信息科学. 2015(04)
[7]SIMD自动向量化编译优化概述[J]. 高伟,赵荣彩,韩林,庞建民,丁锐.  软件学报. 2015(06)
[8]基于CUDA的快速大整数乘法[J]. 许亮,王震.  计算机工程与应用. 2013(16)
[9]PPAT:一种Pthread并行程序线程性能分析工具[J]. 温莎莎,刘轶,刘弢宋,平李,博钱,德沛.  计算机应用与软件. 2012(11)
[10]一种改进的二分查找算法[J]. 邹国霞,何南.  软件导刊. 2010(03)

硕士论文
[1]基于MIC加速部件的长整数基础计算[D]. 赵明祥.华南理工大学 2016
[2]基于MPI和Linux机群环境的FFT算法的并行设计与实现[D]. 卢可佩.曲阜师范大学 2015
[3]基于ElGamal算法的多级匿名通信系统[D]. 许尚妹.西安电子科技大学 2014
[4]基于多核多线程的FFT算法和堆排序算法的并行优化和实现[D]. 徐金棒.郑州大学 2011
[5]公钥密码体制中强素数生成算法与大数乘法的研究[D]. 蔡刚.中南民族大学 2009
[6]RSA公钥密码算法的快速实现[D]. 王安.山东大学 2008



本文编号:3090278

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3090278.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户71e87***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com