当前位置:主页 > 科技论文 > 自动化论文 >

基于深层神经网络的语音增强算法研究

发布时间:2021-05-19 21:10
  在语音信号处理系统中,感兴趣的语音通常会被背景噪声干扰,严重损害了语音的质量和可懂度,作为前端处理模块,语音增强算法成为众多学者的研究焦点,多种语音增强算法已被提出用于噪声抑制,主要包括基于信号处理的方法、基于统计模型的方法和基于模型训练的方法等。在这些方法中,基于信号处理的方法,谱减法和维纳滤波法是两种最具有代表性的算法,当正确估计背景噪声时,该类方法能取得较好的语音增强性能,然而,在现实环境中,尤其是在低信噪比的条件下,由于噪声的随机性和突变性,使得噪声很难被准确估计,导致增强性能大大下降,同时易引入“音乐噪声”;基于统计模型的方法,虽然在低信噪比的条件下也可以取得比较好的增强性能,但是考虑到噪声与语音间的相互关系非常复杂,需要一些信号间的独立性假设以及对特征分布的高斯性假设,然而这些假设通常是理想的,在未知的不匹配噪声条件下,其性能恶化;基于模型训练的语音增强方法在低信噪比、复杂背景噪声条件下表现出了更好的效果。基于深层神经网络的语音增强就是近年来兴起的一种基于模型训练的方法,深层神经网络依靠对复杂特征优秀的抽象和建模能力,在语音信号处理领域引起了广泛的研究,基于深层神经网络的语... 

【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
    1.2 研究现状
    1.3 研究内容和章节安排
第2章 基于自编码器的深度学习语音增强
    2.1 引言
    2.2 基于DNN的语音增强方法
        2.2.1 DNN的网络结构
        2.2.2 DNN的网络训练
    2.3 自编码器
        2.3.1 AE的结构
        2.3.2 AE的训练
    2.4 基于AE的 DNN语音增强方法
        2.4.1 AE中 RBM输出层神经元数量对重构误差的影响
        2.4.2 黄金分割法确定AE中 RBM输出层神经元数量
        2.4.3 网络结构及语音增强流程
    2.5 AEF-DNN语音增强方法性能评估
        2.5.1 实验数据及设置
        2.5.2 对比方法及评价指标
        2.5.3 实验结果及分析
    2.6 本章小结
第3章 基于自编码特征的综合特征语音增强声学特征提取
    3.1 引言
    3.2 组合特征及多分辨率特征
    3.3 AEF特征及Group Lasso算法
        3.3.1 AE训练的公式推导
        3.3.2 特征组合:Group Lasso算法
        3.3.3 基于AEF特征的综合特征语音增强流程
    3.4 方法性能估计
        3.4.1 实验数据
        3.4.2 对比方法及评价指标
        3.4.3 实验结果及分析
    3.5 本章小结
第4章 多目标准则学习
    4.1 引言
    4.2 多目标准则学习
        4.2.1 与频谱包络的联合优化
        4.2.2 与二值掩蔽的联合优化
        4.2.3 与听觉特征的联合优化
    4.3 方法性能评估
        4.3.1 实验数据
        4.3.2 实验分析与结论
    4.4 本章小结
第5章 系统介绍与算法实测
    5.1 语音监听设备
        5.1.1 语音监听设备架构
        5.1.2 语音监听设备硬件平台
    5.2 算法实测
    5.3 本章小结
第6章 总结与展望
    6.1 本文的工作
    6.2 下一步工作的方向
参考文献
发表论文和参加科研情况说明
致谢


【参考文献】:
期刊论文
[1]基于深度学习的短时强降水天气识别[J]. 路志英,任一墨,孙晓磊,贾惠珍.  天津大学学报(自然科学与工程技术版). 2018(02)
[2]基于感知掩蔽深度神经网络的单通道语音增强方法[J]. 韩伟,张雄伟,闵刚,张启业.  自动化学报. 2017(02)
[3]面向基因数据分类的核主成分分析旋转森林算法[J]. 陆慧娟,刘亚卿,孟亚琼,关伟,刘砚秋.  计算机科学与探索. 2017(10)
[4]基于深度学习语音分离技术的研究现状与进展[J]. 刘文举,聂帅,梁山,张学良.  自动化学报. 2016(06)
[5]基于伽马通滤波器组的听觉特征提取算法研究[J]. 王玥,钱志鸿,王雪,程光明.  电子学报. 2010(03)

博士论文
[1]基于深层神经网络的语音增强方法研究[D]. 徐勇.中国科学技术大学 2015



本文编号:3196447

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3196447.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5c01f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com