当前位置:主页 > 科技论文 > 计算机论文 >

基于DSP的嵌入式神经网络计算框架设计与实现

发布时间:2020-04-20 07:14
【摘要】:近年来,深度学习(Deep Learning)的研究和应用进入了爆发阶段,出现了多个适用于移动端的神经网络以及一些模型压缩算法,神经网络开始大规模应用到嵌入式平台,进而产生了越来越多的面向嵌入式平台的神经网络计算框架。这些计算框架主要使用ARM CPU、GPU(Graphics Processing Unit)或者FPGA(Field Programmable Gate Arrays)作为计算加速硬件,但是这些硬件在性能、成本或者功耗上都存在一些问题,难以在这三者之间达到一个较好的平衡,导致这些框架尚未在嵌入式领域大规模应用。相比而言,DSP(Digital Signal Processor)具有较好的性能以及较低的成本和功耗,因此,本文调研了目前嵌入式平台神经网络加速框架存在的问题,研究与实现了基于DSP计算优化的轻量级神经网络计算框架——Lightweight Accelerator for Neural Networks on Embedded System,简称LANNES。该计算框架在嵌入式平台既有不错的性能,又能较好地控制成本和功耗,是一个适用于神经网络在嵌入式平台大规模应用的解决方案。本文设计了适用于DSP平台的神经网络计算框架的架构和底层加速机制。框架架构主要包含三部分:LANNES模型和网络文件、LANNES基础组件和LANNES加速器。在此基础上本文实现了框架的模型和网络文件的转换与加载以及框架的各个基础组件,充分利用DSP的特殊架构,利用内存优化算法和CPU指令级并行优化手段,实现了DSP加速器的性能最大化。本文对所实现的LANNES框架的性能和精度进行了测试和验证,测试表明基于DSP实现的LANNES框架性价比高于基于GPU实现的框架,且性能领先于基于更高成本的4核心ARM CPU实现的计算框架,同时LANNES还具有非常轻量、高易用性和低功耗等优点,此外又能保证计算结果的精度不会受到框架的影响。本研究所提出的基于DSP实现的轻量级神经网络计算框架可以作为神经网络在嵌入式平台大规模应用的优秀解决方案。
【图文】:

架构设计,嵌入式平台


图 1-1 SNPE 架构设计[23]由于 DSP 的开发成本相对于 CPU 和 GPU 较大,而在性能方面能获得的收不如 FPGA,因此,国内外有关基于 DSP 的神经网络计算框架且具有实用和通用性的研究相当匮乏,不如 GPU、FPGA 丰富,而已有的基于 DSP 的网络方面的研究又大多数都停留在基于 DSP 实现的某种具体算法的层面[2但是随着 DSP 厂商逐渐重视其在将神经网络应用到嵌入式平台过程中的作并提供更多的高级开发接口,DSP 的开发难度也有所下降。综上所述,目前对面向嵌入式平台的神经网络计算框架的研究仍存在以下问1) 神经网络在嵌入式平台的计算框架大都使用 ARM CPU 和 GPU 作为加速硬件,极少使用性能、成本和功耗比较平衡的 DSP 的;2) 对于少数支持 DSP 作为加速硬件的框架,,如 MACE 和 SNPE,由于其对软硬件平台和开发条件的限制导致其实用价值和通用性低;

神经元模型


图 2-1 神经元模型神经元的模型中,从输入到计算这一过程称为“连接”,每一个相应的权重。多个神经元组合在一起就成了一个网络层,单层神器,就是只有输入层和输出层的神经网络结构,其中输入层不做层会做计算。单层神经网络中的权值也是通过训练得到,由于它模型,因此只能处理线性问题。度神经网络着研究的深入,研究者尝试在单层神经网络的输入层和输出层之将其称之为隐藏层,其模型如图 2-2 所示。后来的理论研究证明网络,两层的神经网络可以拟合任何连续函数[39],即两层神经网性问题。
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP368.1;TP18

【相似文献】

相关期刊论文 前10条

1 高行山,李红达,叶天麒;结构分析和设计中神经网络计算研究评述[J];计算力学学报;2000年02期

2 李建中;;神经网络计算与生物神经活动[J];阴山学刊(自然科学版);2006年02期

3 来兴平,蔡美峰,张冰川;神经网络计算在采场结构参数分析中的应用[J];煤炭学报;2001年03期

4 M.D.McCormack;朱广生;刘瑞林;;地球物理学中的神经网络计算[J];国外油气勘探;1991年06期

5 朱伟利,陈岩松;用光学方法实现多值神经网络计算[J];量子电子学;1995年01期

6 王利;;用神经网络计算技术从有限气候资料估算实际蒸发蒸腾量[J];四川水利;2008年03期

7 史治平;神经网络计算孔隙度时的样本选择方法研究[J];四川工业学院学报;2000年03期

8 章锦文;马远良;;用于神经网络计算的多处理机系统[J];模式识别与人工智能;1994年02期

9 江明德,健生;用面向对象程序设计模拟神经网络计算[J];计算机应用;1992年06期

10 Muhammad Asif Zahoor RAJA;Iftikhar AHMAD;Imtiaz KHAN;Muhammed Ibrahem SYAM;Abdul Majid WAZWAZ;;用于解决非线性受电弓系统的启发式神经网络计算(英文)[J];Frontiers of Information Technology & Electronic Engineering;2017年04期

相关会议论文 前9条

1 朱坚民;周福章;庞全;;多机并行处理完成神经网络计算[A];1995年中国控制会议论文集(上)[C];1995年

2 陈建功;张永兴;;土层固结系数的神经网络计算法[A];岩石力学新进展与西部开发中的岩土工程问题——中国岩石力学与工程学会第七次学术大会论文集[C];2002年

3 罗立强;;神经网络计算与X射线光谱分析研究[A];中国地质科学院“九五”科技成果汇编[C];2001年

4 朱伟利;陈岩松;;用光学方法实现多值神经网络计算[A];第二届光学前沿问题学术讨论会论文摘要集[C];1994年

5 郑南宁;;类脑计算的问题与视觉认知[A];2015年中国自动化大会摘要集[C];2015年

6 吴琼;;人工神经网络在基片集成波导滤波器设计中的应用[A];安徽省第五届“兴皖之光”青年学术年会论文集(工科卷)[C];2005年

7 郑南宁;任鹏举;陈霸东;吴昊;;类脑(受脑启发的)计算的问题与视觉认知[A];第十九届中国科协年会——分5“智能制造引领东北工业基地振兴”交流研讨会论文集[C];2017年

8 张玉玺;刘寒颖;张耀天;;基于FPGA的sigmoid函数实现[A];第十届全国信号和智能信息处理与应用学术会议专刊[C];2016年

9 陈文新;王长富;戴蓓倩;;基于神经网络的汉语四声识别[A];第一届全国人机语音通讯学术会议(NCMMSC1990)论文集[C];1990年

相关重要报纸文章 前3条

1 微纳电子系;微纳电子系魏少军团队在可重构神经网络计算芯片领域取得重大进展[N];新清华;2017年

2 记者 钱童心;人工智能获评未来10年最具破坏性技术[N];第一财经日报;2017年

3 智雯;英特尔推出神经网络计算单芯片VPU[N];人民邮电;2017年

相关博士学位论文 前1条

1 李海滨;结构有限元分析神经网络计算研究[D];大连理工大学;2003年

相关硕士学位论文 前7条

1 谢启荣;基于DSP的嵌入式神经网络计算框架设计与实现[D];兰州大学;2019年

2 庞淑婷;安全两方的神经网络计算和学习[D];广州大学;2010年

3 崔立X;有限元神经网络计算及其电路实现研究[D];内蒙古工业大学;2005年

4 沈林枫;机器人动力学方程的神经网络计算[D];北京工业大学;2000年

5 陈莉;软计算方法应用于智能决策系统知识处理中的研究[D];西南交通大学;2005年

6 尹潘;神经网络系统开发及巷道变形研究[D];武汉科技大学;2003年

7 孙龙龙;结合律对浮点数加法精确度影响的研究[D];西北师范大学;2014年



本文编号:2634310

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2634310.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户abf8d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com