基于机器学习的声纹识别研发
发布时间:2024-12-17 22:51
声音是人与人之间进行交流的信息载体,声音在人机交互中也起到了举足轻重的作用。声纹识别是语音识别中一个十分重要的方向,这种技术应用到人机交互中就会大大提高人机语音交互的安全性。作为一种生物认证识别方式,声纹识别还有很多重要的应用前景。近些年来,机器学习技术在自动语音识别领域取得了重大的突破,越来越多的机器学习方法尤其是深度学习方法被引入到声纹识别中,并取得了显著的成效。基于i-vector的声纹识别方法是目前与文本不相关声纹识别的基准方法。但这种方法面对短时语音时的识别率较低,也容易受到噪声干扰。本文利用机器学习的理论设计了基于时延神经网络的声纹识别方法,相比于基准方法,这种方法提高了声纹系统的识别率和稳定性,尤其是在短时声音的识别效果方面,应对噪声的鲁棒性也更强。为了进一步提高系统的识别效果,本文又设计了基于生成向量的声纹识别方法,这种方法将基于i-vector的声纹识别方法与基于时延神经网络的声纹识别方法进行了“融合”。此方法利用典型关联分析,将部分i-vector的信息融合到时延神经网络提取的特征向量中,使得生成向量更能表征说话者的身份特征。对三种声纹识别方法进行了实验验证,比如在V...
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
本文编号:4016651
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
图2-3未预处理的语音信号图
黑龙江大学硕士学位论文分帧及加窗端点检测特采样系统预加重模拟信号离散语音信号图2-2语音预处理的主要过程Figure2-2Themainprocessofspeechpreprocessing生的声音信号是模拟信号,所以在对声音信号进行处理之前需对声音信号进行采....
图2-4预加重后的语音信号图
图2-4预加重后的语音信号图Figure2-4VoiceSpectrumDiagramaftePre-emphasis帧加窗音信号是一种随着时间的改变而改变的非平稳的信号,但声音时间里可以看作是平稳的随机信号。可以使用信号处理中对平方法来处理声音信号。使用一些方法....
图2-5加汉明窗前后的声音信号对比图
-10-图(b)加汉明窗后图2-5加汉明窗前后的声音信号对比图Figure2-5Comparisonofvoicesignalsinfrontandrearofthehanmingwindow端点检测段录制的语音中,语音中的声音一般不全是说话者....
图2-6离散傅里叶变换后的语音信号图
黑龙江大学硕士学位论文人类的听觉系统机理的,因此梅尔倒谱系数被广泛应用领域中[41]。人类耳朵的听觉系统对声音的感知是线性的。话者发出声音,如果这些声音的频率十分接近,人耳是很这些频率之间的大小超过一个临界点,这些声音才能被区称为临界带宽。谱系数的提取尔倒谱系数特征提取前,先对声....
本文编号:4016651
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/4016651.html