当前位置:主页 > 科技论文 > 自动化论文 >

基于生成对抗网络的语音增强方法的研究

发布时间:2020-04-05 20:47
【摘要】:语音增强的目的是消除语音信号中的背景噪声与环境干扰,来改善提高污染语音的质量,尽最大可能提取出纯净的没有被污染的语音,多运用在语音识别系统、通信系统中,有非常重要的作用。但是由于环境的多样化,噪声的不稳定性和随机性,并且基本不可能得到所有样本数据,在实际应用中,这些方法很难取得较好的效果。另外,传统的增强方法会对语音信号进行一些分布性的假设,不准确的假设会使增强后的语音与纯净语音信号差别比较大,语音的失真度相对比较高,结果就导致语音的可懂度不高,质量下降。针对这些问题,本文研究基于生成对抗网络的语音增强方法。生成对抗网络属于生成式模型,采用零和博弈的思想让生成器和判别器进行对抗训练。它的生成器不需要对数据的分布做任何假设,最大的优势在于能够学习任何分布下的真实数据,并生成相似分布的数据。此外,生成对抗网络多采用神经网络结构搭建,不仅可以提高模型的泛化能力,还可以加速网络的对抗训练速度,具有非常大的优势。本文的主要工作包括以下两个方面:(1)生成对抗网络损失函数的选择和网络模型的性能紧密相关。通过分析原始生成对抗网络的损失函数在模型训练过程中面临的问题,选择最小二乘损失函数。针对利用生成器重构出的语音信号质量不高的问题,改进了最小二乘损失函数。在生成器的损失函数中引入L1范数,并用超参数ρ来控制L1正则化影响的权重系数,并通过实验得出最优值。针对语音信号的特点,在改进的基础上搭建了基于语音增强的判别器和生成器的网络结构,训练并测试模型的性能。通过与传统的语音增强算法进行比较,得出基于生成对抗网络的语音增强效果好于传统的语音增强算法。(2)本文在深度卷积生成对抗网络的基础上,针对模型在训练过程中收敛速度慢、梯度消失等问题,对生成器和判别器的网络结构进行改进。基于条件生成对抗网络,将判别器抽取的高维抽象特征作为生成器的条件信息,与高斯噪声一同输入到生成器,构建条件生成对抗网络模型。最后通过跟改进前的基于生成对抗网络的语音增强算法进行对比分析,发现生成对抗网络能够获得更好的增强效果,增强后的语音质量得到了提升,也增加了算法的稳定性和泛化能力。
【图文】:

函数对,函数,梯度,最小二乘函数


图4.1 Sigmod 函数和 Least Square 函数对比图发现,,sigmod 函数仅在 0 中心左右的区间上有梯度几乎不变化。而最小二乘函数的梯度只有在取有足够的梯度,因此,最小二乘损失函数在 GAN 度会更加快。

损失函数,交叉熵,判别器


数会将这些样本拉向决策边界,如图 4.3 所示,可以更好的利用模型样本对模型进行训练,收敛速度快,且不会出现梯度消失的问题。图4.2 交叉熵损失函数图4.3 最小二乘损失函数基于这一观察,我们选择最小二乘生成对抗网络(LSGAN)。判别器的损失函数如式(4-7)所示,生成器的损失函数如式(4-8)所示。( )( )( ( ))( )( ( ))2 2~ ~1 1min2 2data zLSGAN x P x z P zDV D E D xb E D G z a = + (4-7)( )( )( ( ))2~1min2zLSGAN z P zGV G E D G z c = (4-8)上式中,通过最小化判别器的损失函数,使真实数据被编码为 a,生成数据被编码为 b。通过最小化生成器的损失函数,使得到生成的数据能够混淆判别器,同时被
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TN912.35;TP183

【相似文献】

相关期刊论文 前10条

1 刘鹏;;基于深度学习的语音增强方法研究[J];智能计算机与应用;2019年05期

2 石玲;;基于计算机声卡的谱相减语音增强系统分析[J];信息与电脑(理论版);2010年02期

3 孙涛;;基于计算机声卡的谱相减语音增强系统分析[J];南昌教育学院学报;2010年05期

4 张晓雷;;基于深度学习的语音增强简述[J];网络新媒体技术;2019年02期

5 李璐君;屈丹;;一种基于组合深层模型的语音增强方法[J];信息工程大学学报;2018年04期

6 袁文浩;娄迎曦;梁春燕;夏斌;;利用生成噪声提高语音增强方法的泛化能力[J];电子学报;2019年04期

7 阴法明;唐於烽;;基于深度置信网络的语音增强算法[J];电子器件;2018年05期

8 余华;唐於烽;赵力;;基于改进深度置信网络的语音增强算法[J];数据采集与处理;2018年05期

9 薛慧君;李盛;路国华;张杨;焦腾;王健琪;荆西京;;提升小波用于非接触语音增强算法的研究[J];医疗卫生装备;2013年05期

10 胡海波;刘柏森;许银;;基于小波变换的语音增强研究[J];黑龙江工程学院学报(自然科学版);2011年01期

相关会议论文 前10条

1 王世伟;胡笑浒;郑成诗;李晓东;;一种改进的基于能量差语音增强算法[A];中国声学学会第九届青年学术会议论文集[C];2011年

2 江峰;李晓东;;适用于抑制非平稳背景噪声的语音增强算法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年

3 阎兆立;杜利民;;维纳后滤波语音增强算法研究[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年

4 童峰;许肖梅;洪青阳;;一种带阶数估计的语音增强算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年

5 袁榕嵘;吴鸣;杨军;;双麦克风语音增强快速算法[A];泛在信息社会中的声学——中国声学学会2010年全国会员代表大会暨学术会议论文集[C];2010年

6 国雁萌;;一种极低信噪比条件下的语音增强方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年

7 李海峰;韩纪庆;郑铁然;;元音、辅音粗判自适应电话语音增强方法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

8 高登峰;杨波;郭东岳;;基于深度神经网络的地空通话语音增强方法[A];第一届空中交通管理系统技术学术年会论文集[C];2018年

9 楼厦厦;郑成诗;李晓东;;滤波器权值约束对自适应零限波束形成语音增强算法鲁棒性影响分析[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年

10 任玉宝;;基于联合字典学习的语音增强算法[A];中国声学学会水声学分会2019年学术会议论文集[C];2019年

相关重要报纸文章 前3条

1 ;NMS Sonata Ⅲ/Studio Sound级语音增强系统话音更清晰[N];中国计算机报;2003年

2 本报记者 马楠;NMS市场目标转向无线服务提供商[N];通信产业报;2001年

3 ;VoIP服务不只是便宜的通话[N];网络世界;2002年

相关博士学位论文 前10条

1 江文斌;面向复杂场景的极低码率语音编解码和语音增强关键技术研究[D];上海交通大学;2018年

2 高天;复杂环境下基于深度学习的语音信号预处理方法研究[D];中国科学技术大学;2018年

3 童仁杰;基于信号稀疏特性的语音增强算法研究[D];中国科学技术大学;2018年

4 王青;基于深层神经网络的多目标学习和融合的语音增强研究[D];中国科学技术大学;2018年

5 王冬霞;麦克风阵列语音增强的若干方法研究[D];大连理工大学;2007年

6 欧世峰;变换域语音增强算法的研究[D];吉林大学;2008年

7 孙琦;基于子空间的低计算复杂度语音增强算法研究[D];吉林大学;2017年

8 夏丙寅;面向移动通信的单通道语音增强方法研究[D];北京工业大学;2014年

9 姚峰英;语音增强系统的研究与实现[D];中国科学院上海冶金研究所;2001年

10 张龙;有监督学习条件下的单通道语音增强算法研究[D];中国科学技术大学;2017年

相关硕士学位论文 前10条

1 李nQ;单声道语音增强关键技术研究[D];重庆邮电大学;2019年

2 吴晓华;基于听觉感知加权的时域语音增强算法研究[D];南京航空航天大学;2019年

3 Guernaz Zineddine;电话和语音识别系统的语音增强[D];哈尔滨工业大学;2019年

4 叶富强;基于主观听觉反馈的机器学习语音增强模型优化研究[D];哈尔滨工业大学;2019年

5 余国修;麦克风阵列语音增强算法研究[D];西安电子科技大学;2019年

6 张鹤鸣;基于深度学习的语音增强方法研究[D];大连理工大学;2019年

7 孙桂琪;基于相空间重构的语音增强方法研究[D];青岛大学;2019年

8 吴卫鹏;基于改进谱减的语音增强算法研究[D];南京邮电大学;2019年

9 张文瑞;基于生成对抗网络的语音增强方法的研究[D];西安电子科技大学;2019年

10 霍陆陆;基于自适应噪声相消的语音增强系统研究[D];西安电子科技大学;2019年



本文编号:2615512

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2615512.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3c77e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com