当前位置:主页 > 科技论文 > 电子信息论文 >

融合CNN推理加速器的高性能NIC的设计与实现

发布时间:2020-09-14 11:06
   随着大数据时代的到来,深度学习技术已经成为人工智能的一大热点,在图像识别、语音识别、自然语言处理方面展现出了巨大的优势,并且在持续发展变化中。其中卷积神经网络(CNNs)是深度学习网络中很重要的一个分支,也发挥着越来越重要的作用。在深度学习技术蓬勃发展的形势下,网络的规模和数据量也越来越大,需要提出一些新的架构来快速高效的处理大规模数据。通用的深度学习加速技术有CPU加速技术、GPU集群加速技术、FPGA加速技术、ASIC加速技术以及内存计算加速技术等。对比深度学习应用的各种加速技术,本文提出了使用FPGA加速技术进行CNN算法的加速和实现。基于之前的研究,本文提出了一种集成CNN推理加速器的高性能网络接口芯片。主机通过PCIE接口发送任务到FPGA加速器,加速器之间通过低延迟链路将任务进行分发和处理,最后将计算结果发回主机。在已有的实验环境下,本文实现了FPGA加速平台的搭建,软硬件通信模块的设计与处理,并实现集成了CNN推理加速模块。通过实验测试,我们验证了原型系统功能的正确性,证明了其良好的可扩展性。
【学位单位】:国防科技大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP18;TN40;TN791
【部分图文】:

伪代码,卷积,全连接,权重


卷积操作示意图及伪代码[5]

结构示意图,卷积,数据集


图 2-4LeNet 结构示意图[6]2.1.4.2AlexNetAlexNet[7]模型是 ILSVRC-2012 的冠军,top-5 的测试错误率仅为 15.3%,超过第二名 10.9%τ第二名为 26.2%υ,该网络模型中参数总量为 60M 左右,共有650000 个神经元,包括 5 个卷积层和 3 个全连接层,有些卷积层后面还跟了最大值池化层,最后的输出层为 1000*1 的 softmax 激活函数层,而输出层为 1000*1 是因为在比赛中只需要针对 1000 类的图片进行识别,其结构示意图如图 2-5 所示 需要说明的是,在 ILSVRC 比赛中所用的数据集为 Imagenet 数据集的一个子集,完整的 Imagenet 数据集中共包括 22000 类的图片

结构示意图,卷积,数据集


图 2-4LeNet 结构示意图[6]2.1.4.2AlexNetAlexNet[7]模型是 ILSVRC-2012 的冠军,top-5 的测试错误率仅为 15.3%,超过第二名 10.9%τ第二名为 26.2%υ,该网络模型中参数总量为 60M 左右,共有650000 个神经元,包括 5 个卷积层和 3 个全连接层,有些卷积层后面还跟了最大值池化层,最后的输出层为 1000*1 的 softmax 激活函数层,而输出层为 1000*1 是因为在比赛中只需要针对 1000 类的图片进行识别,其结构示意图如图 2-5 所示 需要说明的是,在 ILSVRC 比赛中所用的数据集为 Imagenet 数据集的一个子集,完整的 Imagenet 数据集中共包括 22000 类的图片

【相似文献】

相关期刊论文 前10条

1 郭颖;王玉;;负阻效应的存在性研究及NIC在振荡实验中的设计[J];绵阳师范学院学报;2006年02期

2 邹宏军;;NiC镍基药芯焊丝设计及在热连轧板带助卷辊堆焊修复中的应用[J];四川冶金;2013年05期

3 钟云华,刘华,陈沐;康莱特联合NIC治疗晚期非小细胞肺癌的临床观察[J];陕西肿瘤医学;2001年04期

4 孙广旗,杨艳丽,李锐华;基于一种NIC的网络编程[J];工业控制计算机;2001年02期

5 吕勇;王新石;李文新;;斑马鱼肌肉GPT酶的反应体系及对Nic敏感性研究[J];华中师范大学学报(自然科学版);2010年01期

6 李艳雷,高有行;基于PCI总线的快速以太NIC缓冲区管理[J];计算机工程;2003年11期

7 张焱;熊刚;;一种神经网络结合NIC的PN码估计方法[J];通信技术;2013年07期

8 张成霞;赵培元;;通过实验透析子网掩码的作用[J];潍坊教育学院学报;2005年04期

9 靳鑫;张众;;非极化中子超镜用NiC薄膜制作技术研究[J];光学仪器;2017年04期

10 王进英;王新石;李文新;;草鱼肝脏GPT酶的动力学特征及对Nic的敏感性研究[J];华中师范大学学报(自然科学版);2011年01期

相关会议论文 前5条

1 郭卫民;潘雄;;新型结冰信号器用NiC_(0.1)MnMgCu热敏材料的制备及特性研究[A];第七届中国功能材料及其应用学术会议论文集(第5分册)[C];2010年

2 王晋;赵秀强;王志涛;梁宇;乔鑫;;基于汽车座椅鞭打试验的仿真模型改进[A];2015中国汽车工程学会年会论文集(Volume2)[C];2015年

3 梁梦雪;郭凤霞;吴鑫;江涛;石海峰;;霰、冰晶相对增长对NIC起电影响的模拟研究[A];第31届中国气象学会年会S9 第十二届防雷减灾论坛——雷电物理防雷新技术[C];2014年

4 赵秀强;于显峰;王晋;徐晶才;乔鑫;;汽车追尾过程中座椅高度调节器刚度对颈部伤害的影响分析[A];2016中国汽车工程学会年会论文集[C];2016年

5 朱国魂;;基于FPGA的UDP发送工具实现[A];2003中国通信专用集成电路技术及产业发展研讨会论文集[C];2003年

相关硕士学位论文 前6条

1 张凡;融合CNN推理加速器的高性能NIC的设计与实现[D];国防科技大学;2018年

2 许富龙;基于服务元网络体系结构的NIC服务元的研究与实现[D];电子科技大学;2006年

3 陈晓琳;采用ReliefF特征加权的NIC算法研究[D];郑州大学;2014年

4 刘聪;微通信元系统构架中NIC服务元的研究与实现[D];电子科技大学;2005年

5 杨爱红;ETS、Nic及STO暴露引发小鼠成瘾性及毒性的实验研究[D];安徽医科大学;2009年

6 王新石;灭螺药物对钉螺和财鱼GOT酶活力及其蛋白表达的影响研究[D];华中师范大学;2011年



本文编号:2818097

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/dianzigongchenglunwen/2818097.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cd190***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com