面向藏语拉萨话语音识别的语音增强方法研究
发布时间:2021-08-04 02:45
语音增强是针对语音传递中经常遇到的噪音干扰的问题而设计的一种噪音削弱、语音强化的方法。而在语音识别的时候总会有各种或多或少的背景噪音夹杂在语音中。那么语音增强就可以有效的降低背景噪音、强化语音、提升语音识别的效果。本文选题来源于国家自然科学基金项目多民族语言语音识别。该项课题实施中需要解决语音识的噪音问题,故就有了本论文的研究的目的。本文选题的目和意义是解决带噪语音识别困难,改善听取语音质量。研究更有效的区分噪音和藏语拉萨话的增强系统,提升识别的准确率。本文展开了以下的工作:着重探讨和分析了语音增强的技术和藏语语音处理的方法。概述了藏语发音特点和藏语语音学相关知识,在语音预处理和语音数字信号处理知识进行了概要介绍。对于语音增强语料的标准和采集相关流程采用了标准的方法,介绍了如何完成了实验语料的采集和制作,测试语料的制作和测试。本文实验选择了传统单通道语音增方法并对该方法进行研究。传统语音增强方法中研究了几类具有代表性的方法,并进一步探讨了传统语音增强算法的基本原理。分析了各种方法下的语音增强系统的框图,对于各种传统单通道语音增强的技术路线进行了分析,研究了实验结果。同时本文着重探讨和分...
【文章来源】:西北民族大学甘肃省
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
自适应滤波系统流程图
西北民族大学硕士学位论文20图4-2 谱减法系统流程图谱减法增强系统方法步骤1)对y(t)进行短时傅立叶变换求得Y(w)2)通过无话段语音帧长NI,估计噪音功率谱 2 D( )对噪声进行估计、提取噪声功率谱3)语音功率谱和噪音功率谱相减。4)估计的幅度乘以相位信号。| ( )|*yX w ( )5)逆傅立叶变换得到了估计的语音 x ( t)通过以上的方法就可以得到增强后的语音,该方法的数据我们将在第五章稍后讨论。4.4 维纳滤波语音增强维纳滤波法的思路是:对于带噪语音信号,确定滤波器的冲击响应和传递函数的特点,使得带噪语音信号经过该滤波器后得到最接近于增强后的的语音信号。采用维纳滤波的好处是增强后的残留噪声类似于白噪声,而不是有节奏起伏的音乐噪声。维纳滤波是平稳条件下时域波形的最小均方误差准则估计[17]。由于没有考虑到语音频谱分量的幅度对人的听觉最重要,因此采用维纳滤波来增强语音存在一定的缺陷。维纳滤波器的方法对信号的复频谱生成的一个线性估计器,在(复频谱)噪声和语音的 DFT 系数为独立高斯随机变量的条件下,该估计值从最小均方误差意义上看为最优。4.4.1 维纳滤波原理输入信号通过一个线性时不限系统之后产生一个输出信号 y ( n )。使输出信号 d*(n)尽量逼近期望信号 d(n) 。这可以通过计算估计误差 e(n),使其最小化来实
2) 在对加窗分帧后进行快速傅立叶变换,分别求出幅度谱、相位谱,并将其保存下来3) 使用带噪语音初始的无话段语音帧 NI,估计出噪音平均功率谱和平均幅度谱。4) 使用 VAD 检测算法分析带噪语音帧的无话段语音帧,利用帧实时更新噪音的平均功率谱或者幅度谱。5) 先计算有话段帧的后验信噪比概率、再(4.27)估计出语音帧帧的先验信噪比、进一步就求解出了带噪语音帧下的维纳滤波器的传递函数。6) 求解出语音帧的滤波器的输出的幅度谱。7) 将输出的幅度谱和语音的相位谱结合,并进行傅立叶逆变换、再将语音还原到时域阶段,到还原阶段将增强好的语音帧拼接起来,得到增强后的语音信号。具体的系统框图如下。
【参考文献】:
期刊论文
[1]基于改进谱减法的语音增强研究[J]. 刘志坤,唐小明,朱洪伟. 计算机仿真. 2009(06)
[2]藏语文-音自动规则转换及其实现[J]. 李永宏,孔江平,于洪志. 清华大学学报(自然科学版). 2008(S1)
[3]西藏古代的文法研究[J]. 周炜. 西南民族学院学报(哲学社会科学版). 1999(04)
硕士论文
[1]语音识别技术在人机交互中的应用研究[D]. 高雪.北方工业大学 2017
[2]基于深度神经网络的语音增强算法研究[D]. 魏泉水.南京大学 2016
[3]基于深度学习与并行计算的语音增强系统[D]. 石博天.内蒙古大学 2016
[4]基于GPU的深度神经网络模型并行及优化方法研究[D]. 张函.华中科技大学 2016
[5]藏语语音识别技术研究[D]. 拉龙东智.西藏大学 2015
[6]西安方言的声学特征分析和韵律建模的研究[D]. 郭威彤.西北师范大学 2009
[7]LMS算法的改进研究及其在语音增强方面的应用和性能评估[D]. 樊殊昱.电子科技大学 2007
[8]基于小波变换的语音信号增强方法研究[D]. 黄苏雨.南昌大学 2007
本文编号:3320842
【文章来源】:西北民族大学甘肃省
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
自适应滤波系统流程图
西北民族大学硕士学位论文20图4-2 谱减法系统流程图谱减法增强系统方法步骤1)对y(t)进行短时傅立叶变换求得Y(w)2)通过无话段语音帧长NI,估计噪音功率谱 2 D( )对噪声进行估计、提取噪声功率谱3)语音功率谱和噪音功率谱相减。4)估计的幅度乘以相位信号。| ( )|*yX w ( )5)逆傅立叶变换得到了估计的语音 x ( t)通过以上的方法就可以得到增强后的语音,该方法的数据我们将在第五章稍后讨论。4.4 维纳滤波语音增强维纳滤波法的思路是:对于带噪语音信号,确定滤波器的冲击响应和传递函数的特点,使得带噪语音信号经过该滤波器后得到最接近于增强后的的语音信号。采用维纳滤波的好处是增强后的残留噪声类似于白噪声,而不是有节奏起伏的音乐噪声。维纳滤波是平稳条件下时域波形的最小均方误差准则估计[17]。由于没有考虑到语音频谱分量的幅度对人的听觉最重要,因此采用维纳滤波来增强语音存在一定的缺陷。维纳滤波器的方法对信号的复频谱生成的一个线性估计器,在(复频谱)噪声和语音的 DFT 系数为独立高斯随机变量的条件下,该估计值从最小均方误差意义上看为最优。4.4.1 维纳滤波原理输入信号通过一个线性时不限系统之后产生一个输出信号 y ( n )。使输出信号 d*(n)尽量逼近期望信号 d(n) 。这可以通过计算估计误差 e(n),使其最小化来实
2) 在对加窗分帧后进行快速傅立叶变换,分别求出幅度谱、相位谱,并将其保存下来3) 使用带噪语音初始的无话段语音帧 NI,估计出噪音平均功率谱和平均幅度谱。4) 使用 VAD 检测算法分析带噪语音帧的无话段语音帧,利用帧实时更新噪音的平均功率谱或者幅度谱。5) 先计算有话段帧的后验信噪比概率、再(4.27)估计出语音帧帧的先验信噪比、进一步就求解出了带噪语音帧下的维纳滤波器的传递函数。6) 求解出语音帧的滤波器的输出的幅度谱。7) 将输出的幅度谱和语音的相位谱结合,并进行傅立叶逆变换、再将语音还原到时域阶段,到还原阶段将增强好的语音帧拼接起来,得到增强后的语音信号。具体的系统框图如下。
【参考文献】:
期刊论文
[1]基于改进谱减法的语音增强研究[J]. 刘志坤,唐小明,朱洪伟. 计算机仿真. 2009(06)
[2]藏语文-音自动规则转换及其实现[J]. 李永宏,孔江平,于洪志. 清华大学学报(自然科学版). 2008(S1)
[3]西藏古代的文法研究[J]. 周炜. 西南民族学院学报(哲学社会科学版). 1999(04)
硕士论文
[1]语音识别技术在人机交互中的应用研究[D]. 高雪.北方工业大学 2017
[2]基于深度神经网络的语音增强算法研究[D]. 魏泉水.南京大学 2016
[3]基于深度学习与并行计算的语音增强系统[D]. 石博天.内蒙古大学 2016
[4]基于GPU的深度神经网络模型并行及优化方法研究[D]. 张函.华中科技大学 2016
[5]藏语语音识别技术研究[D]. 拉龙东智.西藏大学 2015
[6]西安方言的声学特征分析和韵律建模的研究[D]. 郭威彤.西北师范大学 2009
[7]LMS算法的改进研究及其在语音增强方面的应用和性能评估[D]. 樊殊昱.电子科技大学 2007
[8]基于小波变换的语音信号增强方法研究[D]. 黄苏雨.南昌大学 2007
本文编号:3320842
本文链接:https://www.wllwen.com/kejilunwen/wltx/3320842.html