基于神经网络的声纹识别研究
发布时间:2022-02-09 19:46
随着信息化技术的迅速发展,身份认证已成为了越来越多应用场景中不可或缺的一部分。但是网络智能化带来了方便的同时也带来了隐患。声纹识别又称说话人识别,由于其可靠性、安全性,还有经济便捷的特性,成为了发展空间广泛、商业价值重大的研究热点之一。将神经网络应用在声纹识别中能够大幅提高识别准确率,但是由于声纹识别的研究时间较短,所以仍然有很多问题尚未解决:现有的声纹识别大多需要待识别语音的文本内容一致,即文本相关,但是在实际应用中文本无关的识别应用更广泛;声纹识别需要大量的目标说话人语音数据,如果数据较少会使模型训练不充分、准确率下降;在提取说话人模板时通常使用随机选择样本的方法,但是噪声会使随机选择的方式产生误差;除此之外,语速对现有的声纹识别系统准确率有很大影响,但是还没有针对此现象提出的有效方法。本文主要研究基于神经网络的文本无关说话人确认系统,采用梅尔频率倒谱系数(MFCC)作为语音特征参数,搭建基于深度神经网络(DNN)的声纹识别系统作为基线系统。为了解决在目标说话人数据不足时错误率大幅提升的问题,本文对基线系统做出了改进,最终将改进模型的准确率提高了近10%。其次,本文基于迁移学习原理...
【文章来源】:电子科技大学四川省211工程院校985工程院校教育部直属院校
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
汉明窗与原始波形对比图
梅尔频率与实际频率关系
三角滤波器组
【参考文献】:
期刊论文
[1]声纹识别技术及其应用现状[J]. 郑方,李蓝天,张慧,艾斯卡尔·肉孜. 信息安全研究. 2016(01)
[2]电话语音中基于多说话人的声纹识别系统[J]. 郑燕琳,杨晓炯,许星宇. 电信科学. 2010(S2)
[3]声纹识别技术及其应用[J]. 杨阳,陈永明. 电声技术. 2007(02)
硕士论文
[1]基于Android的声纹识别和语音识别的设计[D]. 司向军.东南大学 2017
[2]卷积神经网络在声纹识别中的应用研究[D]. 胡青.贵州大学 2016
[3]声纹识别相关技术研究及应用[D]. 张芝旖.南京航空航天大学 2016
[4]基于MFCC的声纹识别系统研究[D]. 王正创.江南大学 2014
[5]基于矢量量化与神经网络的声纹识别系统的研究[D]. 徐卫中.重庆大学 2012
本文编号:3617552
【文章来源】:电子科技大学四川省211工程院校985工程院校教育部直属院校
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
汉明窗与原始波形对比图
梅尔频率与实际频率关系
三角滤波器组
【参考文献】:
期刊论文
[1]声纹识别技术及其应用现状[J]. 郑方,李蓝天,张慧,艾斯卡尔·肉孜. 信息安全研究. 2016(01)
[2]电话语音中基于多说话人的声纹识别系统[J]. 郑燕琳,杨晓炯,许星宇. 电信科学. 2010(S2)
[3]声纹识别技术及其应用[J]. 杨阳,陈永明. 电声技术. 2007(02)
硕士论文
[1]基于Android的声纹识别和语音识别的设计[D]. 司向军.东南大学 2017
[2]卷积神经网络在声纹识别中的应用研究[D]. 胡青.贵州大学 2016
[3]声纹识别相关技术研究及应用[D]. 张芝旖.南京航空航天大学 2016
[4]基于MFCC的声纹识别系统研究[D]. 王正创.江南大学 2014
[5]基于矢量量化与神经网络的声纹识别系统的研究[D]. 徐卫中.重庆大学 2012
本文编号:3617552
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3617552.html