当前位置:主页 > 科技论文 > 计算机论文 >

基于GPU的SHA-2哈希算法的快速实现及应用

发布时间:2021-07-07 13:06
  随着十几年来GPU硬件制造技术的不断提升,GPU计算能力以接近摩尔定律的速度飞速发展着。得益于GPU设备的可编程性、高吞吐量和高并发能力,GPU通用计算成为研究热点,也越来越多的被用于高性能计算。作为两大GPU通用计算平台之一的OpenCL平台,提供了更广泛的硬件支持。本文在OpenCL平台上研究基于GPU设备的SHA-2系列哈希算法的快速实现及应用。文章结合GPU硬件结构特点,提出了降低GPU计算量、降低GPU额外开销和增加GPU设备占用率这三条GPU优化原则。在这些原则的基础上,本文总结了一系列存储访问方面和算法结构方面的优化方法,并针对性地提出了 SHA-2系列算法的快速实现方案。本文将SHA-2系列算法的快速实现方案应用于口令恢复,设计并实现了基于GPU的高性能SHA-2 口令恢复算法。该算法支持多种口令恢复模式,实现了不同模式下的并行口令哈希计算。实验数据说明,优化后的SHA-2系列口令恢复算法有效降低了算法计算量和额外开销、有效提高了设备利用率和算法性能,在口令恢复方面比CPU和FPGA设备有着显著优势。在掩码模式下,优化后的SHA-256和SHA-512 口令恢复算法在A... 

【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校

【文章页数】:88 页

【学位级别】:硕士

【部分图文】:

基于GPU的SHA-2哈希算法的快速实现及应用


召GC卜通用标且寄存器LICa己卜们(SGPR.,日K日)

计算单元,单元


??GCN架构的计算单元的设计和上一代架构截然不同,如图2-3所示,每个??GCN计算单元包.括1个标量ALU?(Arithmetic?Logical?Unit,运算器)单元和64个??矢量ALU单元标量ALU単元和8KB的标量逋用寄存器(ScalarGeneral-purpose??Register,简称SGPR>相连;64个矢量ALU单元均分到4个SIMD单元中,每??个SIMD.牟元还拥有一片64KB的矢量通用寄存器.(Vector?General?Purpose?Register,.??简称VGPR)。整个计算单元共享一片16KB的一级读写缓存、指令调度单元和一??些其他硬件资源。??对应到OpenCL标准Jv每个矢鐘ALU单元对应为一个处理单元,每个work-??item运行在不词的矢量ALU单元Jj*在.OpenCL执行模凰中,work-item被组銳??成work-group?C作组的形式存在,同一H作组内的线程会并行运行在同一??个计算单元内,菌一个计算单元可以并行运行多个:!:作组。??GCN架构_的GPU以64个work-item为最小调废單位

模型图,平台,模型,主机


2.2.1平台模型??OpenCL的平台模型包括一个Host?C主机)和一个或多个Device?(设备)[28],??如图2-7所示。OpenCL定义了一个平台统一接D!每家支持OpenCL的硬件厂商??都在统一接口下实现自B的OpenCL库。由于平台接口是统一的i主机可以和不??同的设备通信&??Host??CPU??,?^?|??Device?1?〇???Device?0??Compute?Compute????Unit?Unit??Built-in?Compute?Compute??Unit?Unit??Kernel???????Compute?pE?pE????Unit?I?I??图2-7?0penCL平台模型??Fig.2-7?OpenCL?platform?model??-15?-??


本文编号:3269685

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/3269685.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户59627***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com