基于FPGA的深度信念网络加速系统研究
本文关键词:基于FPGA的深度信念网络加速系统研究 出处:《中国科学技术大学》2017年硕士论文 论文类型:学位论文
更多相关文章: 深度学习 深度信念网络 FPGA 预测过程 能效
【摘要】:近几年,随着深度学习概念的提出,以及计算能力的不断提高,深度学习展示出了很高的科研价值和实用价值,受到了学术界和工业界的青睐。深度学习的概念源于人工神经网络,是机器学习中富有生命力的一个研究领域,其动机在于建立、模拟人脑的神经网络,来解释图像、声音和文本等数据。深度信念网络是深度学习中一种基础的深度神经网络类型,也是一种典型的深度生成式模型,由多层受限玻尔兹曼机堆叠而成。目前深度信念网络普遍应用于语音识别、手写识别、文本分类等应用领域。深度信念网络属于全连接神经网络,因此当网络规模不断增加时,其参数量和计算量均急剧增加。如何更快速有效地处理海量数据,是深度信念网络的主要研究方向之一。目前通过多核处理器集群、云计算平台或通用图像处理器对其加速都有比较成熟的研究,但仍存在计算效率低或能耗开销高等问题。采用现场可编程门阵列FPGA等可编程硬件加速深度学习算法是常用的加速手段之一。基于FPGA的深度学习加速器具有高性能、低功耗、可重构等特点。本文从深度信念网络的预测过程出发,研究在FPGA加速平台上对全连接结构的神经网络的高性能实现,并设计相应的加速系统,主要工作有:1.分析深度信念网络的预测算法,挖掘单层网络内和多层网络间的计算并行性,并根据FPGA的计算资源和存储资源情况,设计算法的基本计算单元,实现单FPGA加速系统。为达到高吞吐率的要求,计算单元主要采用流水线设计。2.将加速器设计扩展到多FPGA加速系统中,将深度信念网络按层横向划分,或层内按块划分,使其计算分布于多片FPGA上,采用流水线或并行计算进一步提升性能。3.根据实现的多FPGA加速系统,提取影响加速系统的关键因素,建立性能模型,分析不同划分方案下的加速系统适用的网络结构和应用场景。为了验证设计的硬件加速系统的性能和性能模型的正确性,本文通过实验,将加速系统的性能与CPU、GPGPU和传统的单FPGA加速系统进行对比。经实验验证,本文实现的加速系统具备良好的加速效果,且运行时功耗和能耗低,具有较高的能效性。
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP181
【相似文献】
相关期刊论文 前10条
1 何长安;赵学琦;;气液压加速系统的仿真建模研究[J];机床与液压;2007年05期
2 王跃辉;何晓锋;魏芳;;针对3G上网用户的无线网络加速系统[J];通信技术;2011年11期
3 范云强;;基于冗余数据消除技术的加速系统的研究[J];黑龙江科技信息;2010年10期
4 炎焱;;如何加速系统恢复[J];每周电脑报;2003年04期
5 张晶,高文,,陈熙霖;面向多媒体的并行加速系统中可重构网络结构设计[J];计算机研究与发展;1995年10期
6 朱怡安,康继昌,韩兆轩;实现加速VAX计算机的方法[J];微电子学与计算机;1991年06期
7 王春雁;;锐捷网络发布PowerCache内容加速系统[J];中国教育信息化;2012年07期
8 王颖;王瑞春;;CDMA EV-DO网络中无线加速系统的部署研究[J];邮电设计技术;2010年03期
9 Stano;时间就是金钱——让系统启动得更快[J];电脑爱好者;2002年16期
10 吴玮;万晨妍;;基于VPN技术的移动加速系统解决方案[J];电脑编程技巧与维护;2008年13期
相关会议论文 前2条
1 蒋路;李旭雯;吴强;贾克斌;;嵌入式高速测量仪器用显示加速系统新方法[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
2 陈佳洱;郭之虞;陆元荣;高淑丽;朱昆;王智;颜学庆;彭士香;赵捷;郭菊芳;李纬国;于茂林;袁忠喜;方家驯;;分离作用RFQ加速系统研究进展[A];第三届全国粒子加速器技术学术交流会论文集[C];2007年
相关硕士学位论文 前10条
1 张琛;互联网缓存加速系统的研究与应用[D];山东大学;2015年
2 韩武琦;一个网页代理加速系统的设计与实现[D];华中科技大学;2014年
3 郑君浩;基于OpenFlow的网络加速系统的设计与实现[D];华南理工大学;2016年
4 周汉清;基于SoPC平台的动态时间规整算法加速系统实现[D];华中科技大学;2016年
5 赵洋洋;基于FPGA的深度信念网络加速系统研究[D];中国科学技术大学;2017年
6 吴结根;移动互联网加速系统设计与应用实践[D];北京邮电大学;2010年
7 李磊;Web加速系统中前端模块的设计与实现[D];北京交通大学;2009年
8 张桦;WEB服务器加速系统设计[D];重庆大学;2006年
9 曹伟;企业web加速系统研究与实现[D];中南大学;2011年
10 杨滨;基于FPGA的BLAS加速系统的设计与研究[D];首都师范大学;2009年
本文编号:1335110
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1335110.html