当前位置:主页 > 科技论文 > 信息工程论文 >

基于深度神经网络的单通道语音分离方法研究

发布时间:2023-04-28 02:38
  语音分离主要有纯净声音与纯净声音的分离、噪声与噪声的分离、纯净声音与噪声的分离,本文主要的工作是研究纯净声音与噪声的分离。人工智能技术的日渐成熟,导致现实生活中依托于语音交互技术的应用变得越来越多,但是周围的一些噪声往往会干扰语音交互的进行,降低语音交互的性能,因此,语音分离技术就变得尤为重要。针对噪声的干扰,最常用的解决方法之一是利用前端语音分离技术。然而,在真实环境中的语音分离技术远没有达到理想化的程度,特别是在噪声不是很稳定的情况下,语音分离技术依然面临着严峻的挑战。近年来,随着各种深层模型不断被挖掘出来,基于深度神经网络(Deep neural network,DNN)的语音分离技术研究变得异常火爆,因为DNN与其它模型相比拥有很强的非线性建模能力,可以更好的对语音进行分离,所以利用DNN在语音分离领域进行研究俨然成为了一种趋势。本文主要的工作如下:(1)本文是基于深度神经网络语音分离方法进行的研究与实现,并针对现有DNN模型的不足,提出了一种多模型组合的语音分离方法(Combine deep neural network,CE-DNN),即把两种不同的训练集放入DNN中进行训...

【文章页数】:62 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题研究背景及其意义
    1.2 语音分离技术的国内外研究现状及分析
        1.2.1 语音分离技术的发展历史
        1.2.2 基于深度学习的语音分离技术
    1.3 论文主要研究内容
    1.4 论文的组织结构
第2章 语音分离的基本理论
    2.1 基于无监督学习的语音分离技术
        2.1.1 谱减法
        2.1.2 自适应滤波算法
        2.1.3 计算听觉场景分析
    2.2 基于有监督学习的语音分离技术
        2.2.1 支持向量机模型
        2.2.2 非负矩阵分解模型
        2.2.3 深度神经网络模型
        2.2.4 深度循环神经网络模型
    2.3 本章小结
第3章 基于多模型组合的语音分离方法
    3.1 基于DNN的语音分离方法
        3.1.1 时频分解
        3.1.2 特征提取
        3.1.3 分离目标
        3.1.4 DNN训练
        3.1.5 波形合成
    3.2 基于CE-DNN的语音分离方法
        3.2.1 模型介绍
        3.2.2 模型优化
        3.2.3 模型步骤
    3.3 实验设计
        3.3.1 数据预处理
        3.3.2 性能评估
        3.3.3 实验结果
    3.4 本章小结
第4章 基于DNN和维纳滤波法结合的语音分离方法
    4.1 模型介绍
        4.1.1 维纳滤波的基本原理
        4.1.2 模型的提出
    4.2 模型优化
    4.3 实验设计与结果
        4.3.1 数据预处理
        4.3.2 评价指标
        4.3.3 基于IRM实验结果
        4.3.4 基于IBM实验结果
    4.4 本章小结
第5章 总结与展望
    5.1 论文总结
    5.2 今后工作展望
参考文献
致谢
攻读学位期间取得的科研成果清单



本文编号:3803569

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3803569.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ed1a9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com