当前位置:主页 > 科技论文 > 网络通信论文 >

基于CNN的短语音识别技术和应用研究

发布时间:2020-09-27 21:33
   语音作为一种生物特征,具有活性高、区分度高和不容易被复制的特点。相比其他的生物特征(人脸、指纹、指静脉和虹膜等),语音特征在身份认证方面有很大的优势。随着互联网的高速发展,网络安全成为了现下网络环境中尤为重要的一个环节。各大互联网公司都投入了大量的资源用于网络身份认证的发展,并取得了一定的成果,如支付宝公司的人脸认证系统、苹果公司的语音解锁功能等。语音智能识别,可分为语音识别和说话人识别。前者用于语音内容的识别后者用于说话人身份的识别,都可以应用于安全认证系统。本文主要进行基于卷积神经网络的短语音识别和应用研究。首先,论文基于小数据集深度神经网络训练不充分的问题,提出数据二值化扩增处理方式。基于ASVD数据集,该方法使网络识别率增加了2.1个百分点,并且收敛过程更加平滑,即不容易陷入局部最优。并进行了仿真与性能分析。然后,论文基于ASVD数据集,搭建了分类卷积神经网络(Classified-Convolution Neural Network,C-CNN),并提出一种连续片段短语音身份认证的模式。通过实验,进行网络参数调优,C-CNN网络在ASVD数据集上有98.3%识别率。并进行了仿真与性能分析。最后,论文基于SVD数据集,搭建了攻击性判定卷积神经网络(Aggressive Decision-Convolution Neural Network,AD-CNN)。并结合C-CNN网络提出了一种基于攻击性判定的身份认证的模式。通过实验,进行网络参数调优,AD-CNN网络在SVD数据集上的识别率达到99.4%。并进行了仿真与性能分析。
【学位单位】:杭州电子科技大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP183;TN912.34
【部分图文】:

流程图,说话人识别,流程图


在多元混合高斯分布中,如果变量 x 的维度 D 很大那么使用全协方差矩阵[56](非对角)将引入大量参数(大约为2M × D)。为了减少这个数量,可以使用对角协方差矩阵mΣ 。当M 很大时,也可以限制所有的协方差矩阵为相同矩阵,对所有的混合成分m ,将参数mΣ 绑定在一起。另一个使用对角协方差的优势是极大地简化了混合高斯分布所需的计算量。将全协方差矩阵近似为对角协方差矩阵可能看似对数据向量使用了各个维度不相关的假设,但这其实是一种误导。因为混合高斯模型具有多个高斯成分,虽然每个成分都使用了对角协方差矩阵,但总体上至少可以有效地描述由一个使用全协方差矩阵地单高斯模型所描述地向量维度相关信息。2.3GMM-UBM 声学建模GMM-UBM 声学模型的出现是说话人识别系统的一个历程碑。传统系统中的说话人识别模块几乎都是基于 GMM-UBM 模型演变而来的。基于 GMM-UBM的说话人识别流程如图 2.2 所示,主要包括两个步骤:基于 EM 算法[57]的 UBM训练和基于最大后验概率(MaximumAPosterior,MAP)的说话人模型训练。

关系图,关系图,阈值,说话人


统错误接受非目标说话人。正常情况下,随着阈值的增加,FRR 的曲线是单调上升的,FAR 的曲线是单调下降的。等错误率就是 FRR 和 FAR 曲线的焦点,对应的阈值点,就是系统阈值的取值。FAR 和 FRR 的关系曲线图如图 2.3 所示:13

结构图,声学模型,结构图


图 2.3 FAR 和 FRR 曲线的关系图由图 2.4 可知,H 点为系统最优阈值点。GMM-UBM 是目前说话人识别的主流模型。但是在实际应用中,几乎很少看到用于说话人身份认证的语音系统,需要新的技术来加强这方面的研究。2.4GMM-HMM 声学建模GMM-HMM 模型是目前声学领域中,语音识别系统普遍采用的建模方案。它能够很好地描述语言内容中的隐含状态和特征序列之间的关系。图 2.4 为GMM-HMM 声学模型结构图。

【相似文献】

相关期刊论文 前10条

1 胡悦;;金融市场中的神经网络拐点预测法[J];金融经济;2017年18期

2 马猛;王明红;;基于进化神经网络的304不锈钢车削加工表面粗糙度预测[J];轻工机械;2019年06期

3 王方;苗放;陈垦;;基于优化神经网络的地质灾害监测预警仿真[J];计算机仿真;2019年11期

4 迟惠生;陈珂;;1995年世界神经网络大会述评[J];国际学术动态;1996年01期

5 吴立可;;脉冲神经网络和行为识别[J];通讯世界;2018年12期

6 林嘉应;郑柏伦;刘捷;;基于卷积神经网络的船舶分类模型[J];信息技术与信息化;2019年02期

7 俞颂华;;卷积神经网络的发展与应用综述[J];信息通信;2019年02期

8 韩真;凯文·哈特尼特;;为神经网络的通用理论建造基石[J];世界科学;2019年04期

9 鲍伟强;陈娟;熊涛;;基于进化神经网络的短期电力负荷预测研究[J];电工技术;2019年11期

10 陈晓燕;;浅析简单神经网络的发展及简单模型[J];数字技术与应用;2019年05期

相关会议论文 前10条

1 孙军田;张U

本文编号:2828398


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2828398.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1ef43***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com