当前位置:主页 > 科技论文 > 计算机论文 >

深度学习加速器中矩阵向量乘部件设计

发布时间:2020-07-07 10:48
【摘要】:基于神经网络的深度学习算法是过去几年发展最为迅速的计算领域之一。从图像/视频/音频识别,到自动翻译、业务分析和自动驾驶,许多新兴的高性能和嵌入式应用都依赖于深度学习算法。深度学习模型常常包含巨大的计算量,而深度学习算法目前往往运行在通用的CPU和GPU,它们的吞吐率和能量效率相对较低。近年来学术界和工业界提出了多种新颖的面向深度学习处理器结构,这些加速器几乎都以大规模的矩阵乘加部件为核心,在其基础上充分考虑深度神经网络的计算特点和数据传输特点,设计符合其计算模式的存储层次和互联结构。从而在吞吐率和功耗上都取得了极大的改进。本课题所研究的矩阵向量乘部件是深度学习加速器的核心功能部件,占据了深度学习加速器的大部分面积,并对加速器的吞吐率具有主要贡献。因此,矩阵向量乘部件的设计与优化,对于深度学习加速器的实现有着关键的作用。具体研究工作如下:矩阵向量乘部件的逻辑设计。根据顶层要求完成指令译码设置,本设计支持3条矩阵向量运算指令。乘法器和加法阵列是矩阵向量乘模块的主要部件,根据不同算法的特点,选取合适的实现方法。乘法器由基4Booth编码、压缩树、并行前缀加法器和溢出判断4部分构成。其中对压缩树和并行前缀加法器的结构进行优化,以至于提高乘法器的性能。对于加法阵列部分,本设计使用4-2压缩树与并行前缀加法器相结合的方式,完成32个16位有符号数求和。矩阵向量乘部件的流水化设计、功能验证和逻辑综合。由于矩阵向量乘运算的延迟较大,对其进行流水化设计。经过仔细的逻辑划分,将运算过程划分为5站,并对每站的逻辑延时进行了较好的平衡。对完成的所有设计进行了验证。验证的方式为,用另一种算法完成乘法器和32个16位有符号数求和。为两种实现方法,输入相同的数据,对比结果,从而完成设计的功能验证。输入的数据采用随机数的方式生成。综合输出的网表用于后续物理实现。矩阵向量乘部件的物理实现。采用层次化的物理设计方法。通过对该部件的结构分析,确定了合理的的子模块划分方法和合理的子模块固化大小。在顶层,优化了宏模块布局,并优化缓冲器插入以实现长线延时缩减。通过以上方法,完成了该部件的的布局布线,并进行了时序分析和物理验证。深度学习矩阵向量部件面积为1300um×3600um,工作频率达到1.1GHz,功耗为1.3W。
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP18;TP332.2
【图文】:

结构图,结构图


ensor Processing Unit)处理器。深度学习处理器代表了现今计算密集和访存密集的神经网络处理器体沿,它们都特别强调对具体神经网络算法应用的支持。纵览这几类典型理,它们都以一个大规模的乘加矩阵作为核心,提供强大的计算能力。量乘部件的设计是整个深度学习处理器的关键之一。.1 国内研究现状几年,中科院计算所 Tianshi Chen 等人提出的 Diannao 系类的神经网络前神经网络硬件实现领域最好的芯片。如图 1.1 Diannao 结构图所示。络模型的数据局部特点以及计算的特点,进行存储体系以及专用硬件更好的性能。之前常用的神经网络的硬件实现方案,即将每个神经元映件计算单元上,具体示意结构图 1.2 全硬件实现方案。方案的优点很明显,实现方案简单,计算性能高,功耗低。缺点也不难,模型的结构和尺寸的增加都会导致该模型失效。

硬件实现,方案


图 1.2 全硬件实现方案是一种专门针对深度神经网络的加速器,它的核心思想将为多次的小的运算。包含了一个权重暂存(Scratchpad M(Neural Function Unit,NFU)和一个控制处理[11](Contro宽度的差异,所以将存储划分为 3 部分,分为 NBin,SB矩阵,NBin 和 NBout 存储的是输入输出向量,把 NBin 和数据冲突。NFU 分为 3 站,分别进行乘法、累加(或 po这 3 站完成神经网络的核心计算。CP 中运行深度神经网和计算。针对一个大网络器模型参数会依此加载到 SB 里被依此加载到 NBin,计算结果被写入到 NBout。NFU 里体神经元或权重参数绑定。通过这种设计,Diannao 在支明显的改进。12]可以认为是 Diannao 面向服务器应用的升级版。在服务严格的指标,反之吞吐率变得更为重要。针对主流神经网

结构图,结构图,架构,神经网络技术


图 1.3 单个 tile 结构图udiannao 也是属于 Diannao 系列。ShiDianNao 的享的特点。将卷积神经网络模型加载到静态存。并将加速器直接与视频图像传感器相连,以o 则是对 7 种机器学习常见算法进行总结,并方案。新的面向特定领域指令集架构(Instruction Se采用 load-store 架构,基于对现有神经网络技术、逻辑运算,以及数据传输和控制指令。Cambr活性,能够支持 10 类不同的神经网路算法;同

【相似文献】

相关期刊论文 前10条

1 傅君明;;高中数学中向量问题的分类解析[J];高中数学教与学;2016年22期

2 金鹏;;在探究中加深理解 在领悟中提升素养——以“向量的概念及表示”的教学为例[J];中学数学月刊;2017年05期

3 周志云;;平面向量备考策略[J];高中数理化;2017年05期

4 杨天育;杨龙婷;;向量在高考数学解题中的应用[J];数学大世界(下旬);2017年06期

5 宋禹;姚诚智;;基于向量方法提出关于空间图形稳定性的设想[J];中学生数理化(学习研究);2017年08期

6 周科;;对考查向量的试题背景分析与教学备考建议[J];数学大世界(上旬);2017年08期

7 崔华梅;戴宏照;;构造圆解决向量问题[J];中学生数学;2017年15期

8 彭雪纯;;基于平面几何性质的向量问题思考[J];数码世界;2017年09期

9 杨春梅;;题有多变 贵在寻根——例谈向量中的三角形中线性质[J];高中数理化;2017年17期

10 冯寅;;架起内心和向量之间的桥梁[J];数理化解题研究;2017年22期

相关会议论文 前10条

1 张晓艳;王挺;陈火旺;;基于多向量和实体模糊匹配的话题关联识别[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

2 刘畅;刘必慰;彭瑾;;深度学习加速器矩阵向量乘部件设计[A];第二十二届计算机工程与工艺年会暨第八届微处理器技术论坛论文集[C];2018年

3 白维娟;;基于APOS理论的向量概念分析[A];教师教育论坛(第一辑)[C];2019年

4 王丹丹;;向量血流图评价房颤患者左心室内流场变化情况[A];中国超声医学工程学会第十一届全国腹部超声医学学术会议论文汇编[C];2016年

5 王丹丹;;向量血流图评价房颤患者左心室内流场变化情况[A];中国超声医学工程学会第十四届全国超声心动图学术会议论文汇编[C];2018年

6 王丹丹;;向量血流图评价房颤患者左心室内流场变化情况[A];中国超声医学工程学会第十三届全国超声心动图学术会议论文汇编[C];2016年

7 王震;赵阳;杨学林;;薄膜结构的向量式有限元断裂行为分析[A];第十五届空间结构学术会议论文集[C];2014年

8 缪浩然;黎塔;梁宏;;改进的词向量特征和CNN在语句分类中的应用[A];第十四届全国人机语音通讯学术会议(NCMMSC’2017)论文集[C];2017年

9 李锋刚;张亚南;汪兵;;基于词向量和AP聚类的短文本主题演化分析[A];第十三届(2018)中国管理学年会论文集[C];2018年

10 陈进于;钱若军;;流固耦合问题的数值分析[A];庆祝刘锡良教授八十华诞暨第八届全国现代结构工程学术研讨会论文集[C];2008年

相关博士学位论文 前5条

1 张明;表示学习词向量提取及其在情感分析中的应用研究[D];江南大学;2019年

2 曾绍华;支持向量回归机算法理论研究与应用[D];重庆大学;2006年

3 曾志强;支持向量分类机的训练与简化算法研究[D];浙江大学;2007年

4 王鑫;基于表示学习的情感分析关键技术研究[D];哈尔滨工业大学;2017年

5 步红刚;基于混合特征向量和单分类检测器的织物瑕疵自动检测研究[D];东华大学;2010年

相关硕士学位论文 前10条

1 谭富文;房产数据向量对齐的算法研究[D];成都理工大学;2019年

2 李丹;基于深度学习的陆空通话复诵校验方法研究[D];中国民航大学;2019年

3 段敏敏;基于词典与词向量融合的文本情感分析研究[D];西安电子科技大学;2019年

4 刘畅;深度学习加速器中矩阵向量乘部件设计[D];西安电子科技大学;2019年

5 冯亦彤;基于攻击向量自动生成的XSS漏洞检测系统的研究与设计[D];北京邮电大学;2019年

6 冯姝桦;专业主观题自动评阅关键技术研究和应用[D];山东大学;2019年

7 刘英杰;在线社交网络舆情话题分析技术研究与实现[D];上海交通大学;2017年

8 徐山山;基于词向量的文本分类研究[D];吉林大学;2019年

9 彭晴;基于支持向量划分的簇标识方法研究[D];吉林大学;2019年

10 徐贝贝;基于词向量的流感病毒宿主预测和病毒序列鉴定[D];湖南大学;2018年



本文编号:2745028

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/2745028.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6c8ac***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com