基于FPGA的深度学习加速器设计与实现
本文关键词:基于FPGA的深度学习加速器设计与实现,由笔耕文化传播整理发布。
【摘要】:近年来,随着计算能力的剧增和学科技术相互渗透、不断发展,机器学习渐渐被大众所认知和接受,并逐渐出现在大众生活中。无论是逛淘宝时物品推荐,汽车无人驾驶,还是轰动一时的人机围棋大战AlphaGo,机器学习让人们感叹科技力量的同时也改善了人们的日常生活。深度学习作为机器学习的新兴领域,起源对人工神经网络的进一步研究,为生物科学和计算机科学相互交叉渗透的产物,其在处理复杂抽象的学习问题上有着出色表现,也因此迅速在学术界和商业界风靡。然而,为了解决更加抽象、更加复杂的学习问题,深度学习的网络规模在不断增加,计算和数据的复杂也随之剧增,比如Google Cat系统网络具有10亿左右个神经元连接。如何高性能低能耗地实现深度学习相关算法,则成为科研机构的研究热点。现场可编程门阵列FPGA作为常用的加速手段之一,具有高性能、低功耗、可编程等特点。本文采用FPGA设计针对深度学习通用计算部分的加速器,主要工作有:1)、分析深度神经网络、卷积神经网络的预测过程和训练过程算法共性和特性,并以此为基础设计FPGA运算单元,算法包括前向计算算法、本地预训练算法和全局训练算法。2)、根据FPGA资源情况设计基本运算单元,包括前向计算单元和权值更新运算单元。运算单元均进行可配置和流水线设计,在适应不同规模深度学习神经网络的同时具有高吞吐率。3)、分析FPGA加速器的上层框架和数据通路,编写linux操作系统下驱动程序以及面向上层用户简单易用的调用接口。4)、通过大量实验测试分析影响加速器性能的各种因素,得到加速器的性能、能耗趋势,使用测试数据集与CPU、GPU平台进行性能、功率、能耗等参数对比,分析FPGA实现的优劣性。
【关键词】:深度学习 人工神经网络 FPGA 预测过程 训练过程 加速器 低功耗
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
- 摘要5-6
- ABSTRACT6-15
- 第1章 绪论15-19
- 1.1 课题背景及意义15-16
- 1.2 国内外研究现状16-17
- 1.2.1 加速技术16-17
- 1.2.2 研究现状17
- 1.3 本文主要工作17-18
- 1.4 论文组织安排18-19
- 第2章 相关技术基础19-35
- 2.1 深度学习的基本概念19-31
- 2.1.1 人工神经网络简介19-21
- 2.1.2 深度学习简介21-22
- 2.1.3 网络拓扑结构22-26
- 2.1.4 相关算法介绍26-31
- 2.2 软硬件协同设计31-33
- 2.2.1 软硬件协同计算模型31-32
- 2.2.2 设计流程32-33
- 2.3 硬件加速技术介绍33-34
- 2.4 本章小结34-35
- 第3章 加速器系统设计35-61
- 3.1 算法分析35-44
- 3.1.1 预测算法35-38
- 3.1.2 训练算法38-42
- 3.1.3 关键技术分析42-44
- 3.2 加速器设计44-54
- 3.2.1 前向计算模块45-52
- 3.2.2 权值更新模块52-54
- 3.2.3 设计说明54
- 3.3 驱动及编程接口设计54-60
- 3.3.1 系统框架54-55
- 3.3.2 驱动程序设计55-57
- 3.3.3 调用接口API封装57-60
- 3.4 本章小结60-61
- 第4章 实验验证和分析61-83
- 4.1 实验环境介绍61-63
- 4.2 性能和能耗趋势63-68
- 4.2.1 预测过程63-65
- 4.2.2 训练过程65-68
- 4.3 性能分布68-79
- 4.3.1 预测过程70-73
- 4.3.2 训练过程73-78
- 4.3.3 小结78-79
- 4.4 各模块功耗及资源利用率79
- 4.5 误差分析79-81
- 4.6 本章小结81-83
- 第5章 总结与展望83-85
- 5.1 工作总结83-84
- 5.2 存在问题和展望84-85
- 参考文献85-89
- 致谢89-91
- 在读期间参加的科研项目91-93
- 在读期间发表的学术论文与取得的研究成果93
【相似文献】
中国期刊全文数据库 前10条
1 云中客;新的神经网络来自于仿生学[J];物理;2001年10期
2 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期
3 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期
4 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期
5 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期
6 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期
7 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期
8 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期
9 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期
10 杨钟瑾;;神经网络的过去、现在和将来[J];青年探索;2006年04期
中国重要会议论文全文数据库 前10条
1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年
2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年
3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年
9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年
2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年
3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年
4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年
5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年
6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年
7 健康时报特约记者 张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年
8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年
9 ;神经网络和模糊逻辑[N];世界金属导报;2002年
10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年
中国博士学位论文全文数据库 前10条
1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年
2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年
3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年
4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年
5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年
6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年
7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年
8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年
9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年
10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年
中国硕士学位论文全文数据库 前10条
1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年
2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年
3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年
4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年
5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年
6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年
7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年
8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年
9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年
10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年
本文关键词:基于FPGA的深度学习加速器设计与实现,,由笔耕文化传播整理发布。
本文编号:376705
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/376705.html