基于非负矩阵分解的双通道语音增强方法研究
发布时间:2020-12-28 21:22
在恶劣的声学环境下由于噪声的影响,会让得到的语音信号充满杂质,质量和语音可懂度都会受到严重影响。因此,需要进行语音增强。在以前的语音增强算法当中,去除噪声的同时很有可能删除掉语音信号部分,影响语音处理系统的性能。目前信号处理被普遍应用于科学工程领域,特别是对于语音信号的研究已经成为了最近几年的热门。作为语音信号处理的一大分支,语音增强算法的目标是为了提升由于各种原因造成信号干扰的语音质量和语音可懂度。在发展传统语音增强算法的基础上,这几年结合机器学习又相继的提出一些新的算法,而非负矩阵分解(Non-negative Matrix Factorization,NMF)又成为这些算法中被使用比较广泛的一个。除了机器学习,麦克风阵列信号处理技术也被广泛的应用于语音增强算法,如自适应波束形成。针对于此,本文把非负矩阵分解和麦克风阵列的相关算法结合起来,利用盲源分离的思想来进行语音信号增强,形成基于非负矩阵分解的双通道语音信号增强方法研究,可以对声音信号进行后期处理。首先,利用麦克风阵列的广义互相关方法得到波达时延估计值。然后,进行非负矩阵方法的改进,改进了非负矩阵分解的初始化。传统的非负矩阵分...
【文章来源】:辽宁大学辽宁省 211工程院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
单源自由场模型
第2章语音增强相关技术8不管什么样的公式都利用了传感器分布的几何形状。对于一维线性均匀麦克风阵列,声波在传输过程中与麦克风阵列形成的角度θ与两个麦克风之间的传输时延有如下关系:cd/cos12(2.4)其中c为声音在空气中传播的速度,通过公式(2.4)可知,时延估计和到达方向估计可以相互推导。2.1.2单源混响模型单源混响模型又被称为语音增强的实际模型,兼顾到了语音信号在封闭环境中的反射影响,已经接受到的语音信号因为反射现象又收到了自身信号的置后信号,比较贴近现实中的语音信号,如下图2-2所示:图2-2单源混响模型第n个麦克风信号为:1,2.....Nn),()(x)()()(ykvkkvksgknnnnn(2.5)ng为源信号到第n个麦克风的通道冲击反应,公式(2.5)也可以写成矩阵的样式:kkkGyN1,2,......n)()()(nnnvs(2.6)式中
第2章语音增强相关技术91,0,1,0,00LnnLnnnggggGTskskskkLksLs)]22()1()1()([)(TLkvkvk)]1()([)(nnnvL是通道冲激响应的最长长度,并且在其中,假设噪音和源信号以及其他麦克风的噪音不相关。和理想模型相比,混响模型显然更复杂,也更难一些。2.2短时傅里叶变换语音信号被麦克风等设备收集并被转换成数字信号,这样一段数字信号,不仅和时间有关系,而且还和频率有关系,快速傅里叶变换就是把语音信号从时域信号变换到频域信号的有效方法。如下图所示为一段语音信号在时域上的波形与转换后的频谱,相比于在时域上的复杂,在频域上的信号就要简洁许多。图2-3信号的时域和频域图虽然语音信号可以用快速傅里叶变换进行处理,但它还是带着缺陷,由于语音信号是非稳定过程,这就有可能造成时域上区别很大的信号在频域上却很相似。平稳信号的产生大部分因为人有意制造的,自然界中大部分是不平稳的。必须考虑更为现实的使用。上文提到过说话人声音信号10到30ms是平稳的,针对于此,提出了短时短时傅里叶变换(Short-timeFourierTransform,STFT)。
【参考文献】:
期刊论文
[1]基于广义二次互相关的低信噪比信号时延估计[J]. 钱隆彦,陈卫松,肖梦迪. 无线电通信技术. 2020(01)
[2]改进的多窗谱谱减法语音增强研究[J]. 姚远,李亚伟,白天皓. 电子测试. 2019(14)
[3]采用性别相关的深度神经网络及非负矩阵分解模型用于单通道语音增强[J]. 李煦,王子腾,王晓飞,付强,颜永红. 声学学报. 2019(02)
[4]联合稀疏非负矩阵分解和神经网络的语音增强[J]. 时文华,倪永婧,张雄伟,邹霞,孙蒙,闵刚. 计算机研究与发展. 2018(11)
[5]基于SCOT双加权二次相关的时延估计算法[J]. 张宇,严天峰. 全球定位系统. 2018(05)
[6]基于广义二次相关的稀疏傅里叶变换时延估计算法[J]. 张宇,严天峰. 电光与控制. 2019(03)
[7]基于稀疏约束非负矩阵分解的K-Means聚类算法[J]. 韩素青,贾茹. 数据采集与处理. 2017(06)
[8]基于改进能熵比的维纳滤波语音增强算法[J]. 王帅,蒲宝明,李相泽,张笑东,姚恺丰. 计算机系统应用. 2017(11)
[9]L1/2稀疏约束卷积非负矩阵分解的单通道语音增强方法[J]. 路成,田猛,周健,王华彬,陶亮. 声学学报. 2017(03)
[10]改进的参数自适应的维纳滤波语音增强算法[J]. 孟欣,马建芬,张雪英. 计算机工程与设计. 2017(03)
硕士论文
[1]基于自适应波束成形的语音增强算法研究与实现[D]. 续娇.北京交通大学 2019
[2]GSC自适应波束形成的后置滤波算法研究[D]. 张禄.哈尔滨工业大学 2018
[3]基于自适应波束形成的语音增强方法研究[D]. 汪洪涛.辽宁大学 2018
[4]空-时自适应滤波远程语音增强方法及实现研究[D]. 胡玥.浙江大学 2017
[5]麦克风阵列自适应波束形成及后置滤波技术研究[D]. 夏杰.重庆邮电大学 2017
[6]基于麦克风阵列的语音增强方法研究[D]. 倪忠.湖南大学 2017
[7]基于单链接和期望最大化规则聚类的包分类技术[D]. 王小慧.湖南师范大学 2016
[8]基于麦克风阵列的语音增强系统设计[D]. 朱兴宇.北京化工大学 2012
本文编号:2944413
【文章来源】:辽宁大学辽宁省 211工程院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
单源自由场模型
第2章语音增强相关技术8不管什么样的公式都利用了传感器分布的几何形状。对于一维线性均匀麦克风阵列,声波在传输过程中与麦克风阵列形成的角度θ与两个麦克风之间的传输时延有如下关系:cd/cos12(2.4)其中c为声音在空气中传播的速度,通过公式(2.4)可知,时延估计和到达方向估计可以相互推导。2.1.2单源混响模型单源混响模型又被称为语音增强的实际模型,兼顾到了语音信号在封闭环境中的反射影响,已经接受到的语音信号因为反射现象又收到了自身信号的置后信号,比较贴近现实中的语音信号,如下图2-2所示:图2-2单源混响模型第n个麦克风信号为:1,2.....Nn),()(x)()()(ykvkkvksgknnnnn(2.5)ng为源信号到第n个麦克风的通道冲击反应,公式(2.5)也可以写成矩阵的样式:kkkGyN1,2,......n)()()(nnnvs(2.6)式中
第2章语音增强相关技术91,0,1,0,00LnnLnnnggggGTskskskkLksLs)]22()1()1()([)(TLkvkvk)]1()([)(nnnvL是通道冲激响应的最长长度,并且在其中,假设噪音和源信号以及其他麦克风的噪音不相关。和理想模型相比,混响模型显然更复杂,也更难一些。2.2短时傅里叶变换语音信号被麦克风等设备收集并被转换成数字信号,这样一段数字信号,不仅和时间有关系,而且还和频率有关系,快速傅里叶变换就是把语音信号从时域信号变换到频域信号的有效方法。如下图所示为一段语音信号在时域上的波形与转换后的频谱,相比于在时域上的复杂,在频域上的信号就要简洁许多。图2-3信号的时域和频域图虽然语音信号可以用快速傅里叶变换进行处理,但它还是带着缺陷,由于语音信号是非稳定过程,这就有可能造成时域上区别很大的信号在频域上却很相似。平稳信号的产生大部分因为人有意制造的,自然界中大部分是不平稳的。必须考虑更为现实的使用。上文提到过说话人声音信号10到30ms是平稳的,针对于此,提出了短时短时傅里叶变换(Short-timeFourierTransform,STFT)。
【参考文献】:
期刊论文
[1]基于广义二次互相关的低信噪比信号时延估计[J]. 钱隆彦,陈卫松,肖梦迪. 无线电通信技术. 2020(01)
[2]改进的多窗谱谱减法语音增强研究[J]. 姚远,李亚伟,白天皓. 电子测试. 2019(14)
[3]采用性别相关的深度神经网络及非负矩阵分解模型用于单通道语音增强[J]. 李煦,王子腾,王晓飞,付强,颜永红. 声学学报. 2019(02)
[4]联合稀疏非负矩阵分解和神经网络的语音增强[J]. 时文华,倪永婧,张雄伟,邹霞,孙蒙,闵刚. 计算机研究与发展. 2018(11)
[5]基于SCOT双加权二次相关的时延估计算法[J]. 张宇,严天峰. 全球定位系统. 2018(05)
[6]基于广义二次相关的稀疏傅里叶变换时延估计算法[J]. 张宇,严天峰. 电光与控制. 2019(03)
[7]基于稀疏约束非负矩阵分解的K-Means聚类算法[J]. 韩素青,贾茹. 数据采集与处理. 2017(06)
[8]基于改进能熵比的维纳滤波语音增强算法[J]. 王帅,蒲宝明,李相泽,张笑东,姚恺丰. 计算机系统应用. 2017(11)
[9]L1/2稀疏约束卷积非负矩阵分解的单通道语音增强方法[J]. 路成,田猛,周健,王华彬,陶亮. 声学学报. 2017(03)
[10]改进的参数自适应的维纳滤波语音增强算法[J]. 孟欣,马建芬,张雪英. 计算机工程与设计. 2017(03)
硕士论文
[1]基于自适应波束成形的语音增强算法研究与实现[D]. 续娇.北京交通大学 2019
[2]GSC自适应波束形成的后置滤波算法研究[D]. 张禄.哈尔滨工业大学 2018
[3]基于自适应波束形成的语音增强方法研究[D]. 汪洪涛.辽宁大学 2018
[4]空-时自适应滤波远程语音增强方法及实现研究[D]. 胡玥.浙江大学 2017
[5]麦克风阵列自适应波束形成及后置滤波技术研究[D]. 夏杰.重庆邮电大学 2017
[6]基于麦克风阵列的语音增强方法研究[D]. 倪忠.湖南大学 2017
[7]基于单链接和期望最大化规则聚类的包分类技术[D]. 王小慧.湖南师范大学 2016
[8]基于麦克风阵列的语音增强系统设计[D]. 朱兴宇.北京化工大学 2012
本文编号:2944413
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2944413.html