当前位置:主页 > 科技论文 > 计算机论文 >

基于XNOR算法的FPGA加速IP设计与验证

发布时间:2020-07-18 00:32
【摘要】:随着2012年AlexNet的横空出世,运用卷积神经网络的深度学习方法逐渐成为了的图像处理的热门方向,并且已经有许多实用部署。而包括当前最主要的部署平台GPU在内的各种神经网络部署平台都存在各自的缺点。GPU功耗过高、价格昂贵;CPU计算能力难以使神经网络部署达到很好的效果;ASIC难以适应当前未完全成熟的神经网络模型的迭代更新。FPGA配置灵活,能够提供强大的并行处理能力。但其相对GPU来说,存在浮点运算能力相对较弱,开发周期长的缺点。本文针对FPGA的这些缺点,提出一个针对XNOR算法的FPGA IP核实现方法,性能优良。设计采用XILINX HLS方法,使得可移植性大大提高,降低了FPGA开发周期。采用XNOR算法的神经网络在网络精准度良好的情况下,使用单比特数据对权重及输入进行表示。在大大降低其权重所需的存储空间的同时,使得运算仅需要通过逻辑操作进行。本文首先分析了卷积神经网络当中各种类型层的计算步骤,并且分析了XNOR的算法实现及训练步骤。然后归纳了采用XNOR算法的神经网络的结构特点,并提取了设计中的关键参数。最后设计了加速IP,获得了与当前主流加速器相当的性能。本文使用该方法通过XNOR的AlexNet对其有效性进行验证。然后使用XNOR算法,对LeNet进行改造,应用在包含DSP与FPGA的硬件平台上,以验证本设计方法的有效性及可移植性,取得了不错的效果。
【学位授予单位】:国防科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP332;TP183
【图文】:

结构网络,准确率


图 1.1 各类结构网络 top-1 准确率在图像处理的另外一些重要任务中,神经网络也取得了比较大的进展。如人脸中 DeepFace[5]算法,其为 FaceBook 提出的人脸识别网络。其做法是先将输入脸图片进行对齐,将对齐后的图片输入到卷积神经网络中,在 LFW(Labeles in the Wild)上取得了 97.35%的准确率。MTCNN 算法[6]则使用多个网络共

网络结构图,网络结构,运算公式,增强模型


图 1.2 RNN 网络结构其运算公式如下: = ( 1)其中 通常是非线性激活函数,用来增强模型的表达能力。x 是输入

多层感知机,图像,像素,图片


图 2.4 多层感知机由于图像存在局部相关性。像素与周围像素存在更为密切的关系,而与其距离远的像素则关系较弱。卷积神经网络利用这种特点,进行局部连接操作,神经元输入并不与整幅图片进行连接,而仅仅与图片当中一部分像素进行连接。然后通共享权值的方式将一个神经元的全连接计算转变为神经元在输入图片的滑窗操

【相似文献】

相关期刊论文 前10条

1 胡悦;;金融市场中的神经网络拐点预测法[J];金融经济;2017年18期

2 迟惠生;陈珂;;1995年世界神经网络大会述评[J];国际学术动态;1996年01期

3 王方;苗放;陈垦;;基于优化神经网络的地质灾害监测预警仿真[J];计算机仿真;2019年11期

4 马猛;王明红;;基于进化神经网络的304不锈钢车削加工表面粗糙度预测[J];轻工机械;2019年06期

5 庄连生;吕扬;杨健;李厚强;;时频联合长时循环神经网络[J];计算机研究与发展;2019年12期

6 吴立可;;脉冲神经网络和行为识别[J];通讯世界;2018年12期

7 林嘉应;郑柏伦;刘捷;;基于卷积神经网络的船舶分类模型[J];信息技术与信息化;2019年02期

8 俞颂华;;卷积神经网络的发展与应用综述[J];信息通信;2019年02期

9 韩真;凯文·哈特尼特;;为神经网络的通用理论建造基石[J];世界科学;2019年04期

10 鲍伟强;陈娟;熊涛;;基于进化神经网络的短期电力负荷预测研究[J];电工技术;2019年11期

相关会议论文 前10条

1 孙军田;张U

本文编号:2760139


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2760139.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户11b2d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com