噪声下的语音识别算法研究
发布时间:2020-06-26 02:06
【摘要】:随着科学的进步和技术的发展,语音识别算法和相应的识别系统已经相当成熟。动态时间规整算法(DTW)、矢量量化算法(VQ)、隐马尔可夫模型(HMM)以及人工神经网络(ANN)等算法,使得语音识别无论是识别率还是识别效率上都有较大的提升。目前,在实验室环境下,语音识别系统对纯净语音的识别率能够达到95%以上,具有一个非常高的识别精度。但是复杂噪声环境中,具有各种来源的噪声。在这样的噪声环境下,语音识别系统的识别率会受到很大的影响,由于训练样本与样本库特征的失配,使得系统的识别性能急剧下降。因此,若要将语音识别系统进行有效的实际应用,如何设计出抗噪声的识别将是目前真正需要解决的问题。本文首先从近几十年的语音识别的发展出发,介绍了语音识别系统的基本概念以及整体结构,包括对语音信号进行采样,语音分离去噪,预加重,分帧加窗,进行端点检测等过程进行了介绍,并详细对端点检测的两种方法进行分析说明。之后对车载语音识别系统进行了介绍,并结合相关需求,引入战场指挥车车载语音识别系统的概念,通过公交车环境对战场指挥车进行模拟,验证去噪算法的性能。然后本文介绍了车载语音识别系统所面对的汽车噪声,从噪声来源和噪声频谱特性对汽车噪声进行分析。接着从去噪技术入手,研究在噪声存在的情况下语音信号分离方法。重点介绍了基于盲信号分离和禁忌搜索算法的去噪声技术,将盲信号分离技术用于车载复杂噪声环境下的去噪,通过测试波形分离,验证在复杂环境下的盲信号分离性能。接下来本文介绍语音信号的特征参数的提取。对比LPC系数、LPCC系数以及MFCC系数,并在最后的实验中进行对比选择。在进行特征参数提取后,本文又对矢量量化技术进行介绍,重点介绍设计码本的LBG算法。此外,本文还对基于HMM的语音识别技术进行了研究。包括对HMM模型概念的介绍,HMM在语音识别系统中存在的三个问题。并从问题出发,通过对这三个问题的解决来建立基于HMM的语音识别系统。在此基础上,提出多段式HMM算法,将原有的语音识别系统进行改进。最后,为了验证去噪算法以及多段式HMM语音识别系统的性能,设计了一系列的实验。首先选取四个小型的语音库在四种不同的环境下进行识别系统的性能测试,包括特征参数的选取、码本容量和HMM状态数的确定,以及在不同环境中受到的环境噪声影响的大小等。之后,为了验证去噪算法的性能,设计了在四种具有不同种类噪声的环境下进行的识别率和识别时间的对比实验。在不同的环境中,使用动态时间规整算法、基于小波变换的语音增强算法以及本文所采用的基于盲信号分离的多段式HMM识别算法,分别获取这三种算法的识别率以及识别时间。通过这两个最直观的数据来对算法性能进行验证。
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.34
【图文】:
图1-1典型语音识别系统基本框架图逡逑语音识别系统实际是模式识别学科在实际中的应用口]。首先,W人类语音特逡逑点为基础,计算机建立相应的语音模型。通过分析输入语音信号,提取信号中的逡逑语音特征,建立语音识别系统中所需的模板库。当有待识别语音输入到识别系统逡逑中,计算机同样对该语音信号进行特征提取,并通过某种搜索和匹配算法,将该逡逑特征与在计算机中存储的模板进行匹配,从而寻找出与输入信号特征匹配的基本逡逑识别结果,再经过后处理之后,计算机会给出最终的识别结果。在整个识别系统逡逑中,影响识别率的关键就在于特征的选择、模板库的优劣化及匹配算法的性能[6]。逡逑1.1.2语音识别技术的应用逡逑目前,语音识别系统的应用范围相当广泛,如信息查询、服务系统、汽车导逡逑航设备、智能语音翻译、工业控制系统等[7]。在这些领域中,操作人员往往因为逡逑手被占用,或者不存在键盘输入条件,无法用传统的方式进行正常的人机交互。逡逑此时,要想增加控制操作,应该X椉有碌氖褂玫慕换シ绞健@糜镆舳曰鞣⒊鲥义
本文编号:2729664
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.34
【图文】:
图1-1典型语音识别系统基本框架图逡逑语音识别系统实际是模式识别学科在实际中的应用口]。首先,W人类语音特逡逑点为基础,计算机建立相应的语音模型。通过分析输入语音信号,提取信号中的逡逑语音特征,建立语音识别系统中所需的模板库。当有待识别语音输入到识别系统逡逑中,计算机同样对该语音信号进行特征提取,并通过某种搜索和匹配算法,将该逡逑特征与在计算机中存储的模板进行匹配,从而寻找出与输入信号特征匹配的基本逡逑识别结果,再经过后处理之后,计算机会给出最终的识别结果。在整个识别系统逡逑中,影响识别率的关键就在于特征的选择、模板库的优劣化及匹配算法的性能[6]。逡逑1.1.2语音识别技术的应用逡逑目前,语音识别系统的应用范围相当广泛,如信息查询、服务系统、汽车导逡逑航设备、智能语音翻译、工业控制系统等[7]。在这些领域中,操作人员往往因为逡逑手被占用,或者不存在键盘输入条件,无法用传统的方式进行正常的人机交互。逡逑此时,要想增加控制操作,应该X椉有碌氖褂玫慕换シ绞健@糜镆舳曰鞣⒊鲥义
本文编号:2729664
本文链接:https://www.wllwen.com/kejilunwen/wltx/2729664.html