基于深度学习的序列识别模型压缩与加速研究
发布时间:2021-09-16 18:42
近年来,基于深度学习的序列识别模型显著提升了光学字符识别(Optical Character Recognition,OCR)、自动语音识别(Automatic Speech Recognition,ASR)等任务的性能。然而,在取得优异识别性能的同时,这些模型的层数越来越多,结构越来越复杂,因此模型的参数量和计算量也越来越庞大。为了能够将模型部署到计算能力有限的机器上(如云端CPU服务器)以在产品中得到应用,需要对模型进行最大限度的压缩与加速。本文围绕两种在OCR、ASR任务上广泛使用的基于深度学习的序列识别模型,即结合了卷积神经网络(Convolutional Neural Network,CNN)、深度双向长短时记忆元网络(Deep Bidirectional Long Short-Term Memory,DBLSTM)的CNN-DBLSTM字符模型,和以连接时序分类(Connectionist Temporal Classification,CTC)为训练准则的 LSTM 声学模型,展开模型压缩方法的研究,实现运行时加速的目的。首先,针对CNN-DBLSTM字符模型,本文提出使...
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:146 页
【学位级别】:博士
【部分图文】:
图2.2卷积操作示意图??
图2.3池化操作示意图??
图2.4?(a)含有一个隐层的单向RNN前向传播示意图(b)含有一个隐层的双向RNN前??
本文编号:3397095
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:146 页
【学位级别】:博士
【部分图文】:
图2.2卷积操作示意图??
图2.3池化操作示意图??
图2.4?(a)含有一个隐层的单向RNN前向传播示意图(b)含有一个隐层的双向RNN前??
本文编号:3397095
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3397095.html