基于生成对抗网络合成噪声的语音增强方法研究
发布时间:2023-02-15 19:59
在语音增强领域,深度神经网络通过对大量含有不同噪声的语音以监督学习方式进行训练建模,从而提升网络的语音增强能力。然而不同类型噪声的获取成本较大,噪声类型难以全面采集,影响了模型的泛化能力。针对这个问题,提出一种基于生成对抗网络(Generative Adversarial Networks,GAN)的噪声数据样本增强方法,该方法对真实噪声数据进行学习,根据数据特征合成虚拟噪声,以此扩充训练集中噪声数据的数量和类型。通过实验验证,所采用的噪声合成方法能够有效扩展训练集中噪声来源,增强模型的泛化能力,有效提高语音信号去噪处理后的信噪比和可理解性。
【文章页数】:5 页
【文章目录】:
0 引言
1 生成对抗网络
1.1 GAN的简单介绍
1.2 噪声生成网络WGAN
1.2.1 输入和输出
1.2.2 网络结构
1.3 语音增强网络SEGAN
2 实验
2.1 实验配置
2.2 实验结果
2.2.1 生成噪音数据样本
2.2.2 基于SEGAN模型的语音增强性能比较
3 结论
本文编号:3743752
【文章页数】:5 页
【文章目录】:
0 引言
1 生成对抗网络
1.1 GAN的简单介绍
1.2 噪声生成网络WGAN
1.2.1 输入和输出
1.2.2 网络结构
1.3 语音增强网络SEGAN
2 实验
2.1 实验配置
2.2 实验结果
2.2.1 生成噪音数据样本
2.2.2 基于SEGAN模型的语音增强性能比较
3 结论
本文编号:3743752
本文链接:https://www.wllwen.com/kejilunwen/wltx/3743752.html