当前位置:主页 > 科技论文 > 信息工程论文 >

基于深度神经网络的单通道语音分离技术及研究

发布时间:2020-10-27 20:45
   语言作为人类交流最重要的手段,在现实生活中有着广泛的应用,但是语音在传达过程中易受周围环境所影响,导致语音的质量受损。因而,出现了语音分离技术。语音分离有人声与噪声的分离、人声与人声的分离,且生活中绝大多数应用场景中只有一个麦克风设备,本文主要研究的工作是单通道情况下人声与噪声的分离。近年来,深度学习被广泛地应用于语音信号处理领域中,其中,深度神经网络(Deep Neural Networks,DNN)在语音分离领域表现出了强大的优势。层次化的非线性处理使得DNN具有强大的表示学习的能力,但是由于语音信号是一个非稳态的、时变的信号,用DNN分离后的语音仍然存在着噪声的干扰以及噪声估计不准确的问题,影响了语音信号的质量,针对传统DNN语音分离中噪声干扰的问题,提出以下两种改进方法:(1)在DNN预训练阶段,用受限玻尔兹曼机进行网络预训练,最小化网络输出的语音特征与纯净语音特征之间的误差,将该误差用反向传播算法来更新网络的权值,经过一系列的更新迭代后得到训练好的DNN语音分离模型。(2)将DNN与谱减法进行结合,利用语音信号的相邻时频单元能量具有连续性的原理,用谱减法对相应时频块中每个时频单元分别进行噪声能量估计,用混合语音信号能量功率谱减去估计噪声能量功率谱,达到语音与噪声分离的目的。语音分离训练目标的好坏关系到合成目标语音的质量,用理想二值掩蔽和理想比例掩蔽分别作为训练目标,在同等实验参数设置以及相同数据集上进行实验。本文完成了两个实验,其中每个实验都是在标准语音库TIMIT中选择相同数据集使用DNN来完成的,经实验结果表明,方法一明显降低了输出语音与纯净语音之间的误差,使得分离语音的可懂度和相似系数都得到了显著提高。方法二使得分离语音的可懂度和信噪比得到了显著提高,并且分离语音的信号更接近于纯净语音的信号。
【学位单位】:闽南师范大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:TN912.3;TP183
【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题研究意义
    1.2 国内外研究现状
    1.3 本文主要内容
    1.4 本文组织结构
第2章 语音分离的相关知识
    2.1 语音的产生和感知
        2.1.1 语音信号的产生
        2.1.2 人耳的听觉感受性
        2.1.3 掩蔽效应
    2.2 常见单通道语音分离技术
        2.2.1 基于计算听觉场景分析的语音分离算法
        2.2.2 基于信号处理语音分离算法
        2.2.3 基于模型的语音分离算法
    2.3 本章小结
第3章 基于受限玻尔兹曼机的DNN语音分离
    3.1 DNN网络结构
    3.2 时频分解
    3.3 特征提取
    3.4 分离目标
    3.5 改进模型训练
    3.6 波形合成
    3.7 实验与结果分析
        3.7.1 实验数据与实验设置
        3.7.2 评价指标
        3.7.3 实验结果分析
    3.8 本章小结
第4章 基于DNN和谱减法相结合的语音分离方法
    4.1 问题描述
    4.2 模型提出
    4.3 谱减去噪
    4.4 模型步骤
    4.5 实验与结果分析
        4.5.1 实验数据与实验设置
        4.5.2 评价指标
        4.5.3 IRM实验结果分析
        4.5.4 IBM实验结果分析
        4.5.5 IBM与 IRM对比实验结果分析
    4.6 本章小结
第5章 总结与展望
    5.1 工作总结
    5.2 工作展望
参考文献
致谢
攻读学位期间取得的科研成果清单

【相似文献】

相关期刊论文 前10条

1 徐方鑫;;瑞米兹交替算法在语音分离上的应用[J];电脑知识与技术;2012年03期

2 杨海滨;张军;;基于模型的单通道语音分离综述[J];计算机应用研究;2010年11期

3 施剑;杜利民;;基于麦克阵列的实时盲语音分离系统[J];微计算机应用;2008年05期

4 王光艳;张艳;李玥玲;马肖蓉;;稀疏分量分析在水下盲语音分离中的应用研究[J];电子世界;2019年03期

5 范存航;刘斌;陶建华;温正棋;易江燕;;一种基于卷积神经网络的端到端语音分离方法[J];信号处理;2019年04期

6 张磊;刘继芳;项学智;;基于计算听觉场景分析的混合语音分离[J];计算机工程;2010年14期

7 张雪峰,刘建强,冯大政;一种快速的频域盲语音分离系统[J];信号处理;2005年05期

8 虞晓,胡光锐;基于高斯混合密度函数估计的语音分离[J];上海交通大学学报;2000年01期

9 丁慧,徐柏龄;自适应降噪系统的语音分离研究[J];声学学报;2004年01期

10 陈锴;卢晶;徐柏龄;;基于话者状态检测的自适应语音分离方法的研究[J];声学学报;2006年03期


相关博士学位论文 前8条

1 李曾玺;基于自回归深度神经网络的单通道语音分离方法研究[D];中国科学技术大学;2019年

2 张晖;基于深度学习的语音分离研究[D];内蒙古大学;2017年

3 王燕南;基于深度学习的说话人无关单通道语音分离[D];中国科学技术大学;2017年

4 胡琦;基于计算听觉场景分析的单信道语言分离[D];北京交通大学;2014年

5 鲍光照;基于稀疏表示和字典学习的语音增强算法研究[D];中国科学技术大学;2015年

6 王雨;基于计算听觉场景分析的单通道语音分离研究[D];华东理工大学;2013年

7 赵立恒;基于计算听觉场景分析的单声道语音分离研究[D];中国科学技术大学;2012年

8 郭海燕;基于稀疏分解的单通道混合语音分离算法研究[D];南京邮电大学;2011年


相关硕士学位论文 前10条

1 冯利琪;基于深度神经网络的单通道语音分离技术及研究[D];闽南师范大学;2019年

2 闵长伟;基于深度神经网络的单通道语音分离方法研究[D];闽南师范大学;2019年

3 徐丹丹;基于生成对抗网络的端到端多语音分离技术研究[D];哈尔滨工程大学;2018年

4 王凯龙;基于计算听觉场景分析的多人语音分离方法[D];南京理工大学;2018年

5 毛振苏;基于时延神经网络的语音分离的研究[D];内蒙古大学;2018年

6 李光鹏;基于神经网络的语音分离及其DSP实现[D];内蒙古大学;2018年

7 王贺;面向语音分离的算法研究与实现技术[D];国防科学技术大学;2016年

8 姚森;基于深度学习的语音分离和识别技术研究[D];哈尔滨工程大学;2018年

9 朱竑谕;基于人耳听觉特性的语音分离研究[D];东南大学;2018年

10 张婷;基于深度学习的有监督语音分离方法研究[D];山东大学;2018年



本文编号:2859041

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/2859041.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9bfbf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com