基于深度学习的声纹识别技术研究

发布时间：2020-12-31 03:05

　　随着深度学习的发展,研究方向从最开始的图片领域扩展到语音识别、声纹识别和自然语音处理等方面。其中声纹识别被当作识别人身份的一种生物认证技术也逐渐得到了关注,该技术是通过在不受干扰的前提下对说话人的语音信号进行提取与处理,从而获得能表征说话人的个性信息。深度学习的出现,解决了传统模型中因局部最优带来的过拟合问题,且可以更好的对说话人的特征进行学习。为了使深度学习在声纹识别中得到更好的应用,本文从以下几个方面进行研究。第一:介绍了声纹识别研究背景与历史发展,分析了传统声纹识别方法的缺点并引出了深度学习作为声纹识别的研究方向。第二:对语音信号的前端处理进行研究,其中包含了对语音信号预处理和语音信号增强技术的研究。本文在基本谱减法的基础上提出了自适应多窗谱减法,该算法根据输入语音信号的信噪比自适应调整参数,解决了基本谱减法中因参数固定而导致的重要信息缺失问题,增强了语音信号降噪效果。第三:对基于长短时记忆网络（LSTM）的声纹识别方法进行研究,构建LSTM网络模型,并在已有的LSTM网络模型的基础上,采用滑动窗口对输入序列进行切分,保持了语音信号的连续性;在声纹识别的判决中,引入片段相似性损失...

【文章来源】：杭州电子科技大学浙江省

【文章页数】：70 页

【学位级别】：硕士

【部分图文】：

基于深度学习的声纹识别技术研究

滤波器幅频与相频特性

频谱图,预加重,语音,频谱图

杭州电子科技大学硕士学位论文20图3.2滤波器幅频与相频特性图3.3预加重前后语音信号和频谱图在对语音信号进行预加重的处理步骤之后，可能会造成语音信号失真的问题，为了避免该问题的出现，一般在预加重结束之后再对语音信号进行去加重的处理，其表达式为。111)(=uzzH（3.2）

波形,语音,波形

杭州电子科技大学硕士学位论文26图3.9多窗谱谱减法参数自适应的算法实现框图3.2.3实验结果分析在本文试验中所用的语音信号的频率为16khz的纯语音信号。3.2.3.1加窗对比在该小节实验中，为了验证海明窗在语音增强中的表现优于矩形窗和汉宁窗。所以，在该实验中，分别采用矩形窗、汉宁窗和海明窗对语音信号进行分帧处理，并在该纯语音信号的基础上叠加0dB的白噪声。在该实验中，时域语音波形上的显示如图3.10所示（为纯净语音）、图3.11（叠加白噪声之后的语音）、图3.12~图3.14表示分别表示经过矩形窗、汉宁窗和海明窗的输出语音信号波形。图3.10纯净语音波形()ixm经DFT得()ixk原始语音信号分帧()ixm判断所用窗函数是否为海明窗计算平均功率(,)nPki和噪声功率谱D(k)运行不同窗函数的谱减算法根据输入信号的信噪比，使得g(k,i)得到最优解计算谱减幅值|()|iXk将|()|iXk进行IFFT得到()ixn计算经自适应多窗谱减法后提高的信噪比并输出否是图3.11纯净语音叠加白噪声后的波形

本文编号：2948832

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2948832.html

上一篇：面向疾病诊断的多分类器集成方法研究
下一篇：轮式移动机器人的队形控制研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|