当前位置:主页 > 科技论文 > 网络通信论文 >

语音分离与语音识别关键技术研究

发布时间:2022-01-16 16:34
  语音作为人类最为基础的信息交流媒介,一直以来都是工业界与学术界研究的重点,本文主要针对语音分离与语音识别问题进行研究。其一,由于现实环境中语音环境复杂,语音的可懂度受到较大干扰。语音分离技术是解决此问题最常用的方法之一,目前的语音分离技术存在语音信号表征不充分、难以从混合语音中学习到有用信息等问题;其二,语音识别技术的目标为将语音信号识别为对应的文本序列。然而,许多系统只需要检测出其中的关键词即可,这种技术称为关键词识别技术。目前,随着深度学习的兴起,基于深度学习的关键词识别模型多为按帧标注方法,需要较为成熟的大规模连续语音识别系统对训练样本进行按帧标注,该类模型先决条件较为苛刻,且不灵活。针对语音分离与关键词识别目前研究存在的问题,本文的研究内容主要包括以下两方面的内容:1.针对于语音分离存在的语音信号表征不充分、难以从混合语音中学习到有用信息的问题,本文提出深层转导式非负矩阵分解(DTNMF)方法,在非负矩阵分解(NMF)的基础上,引入了全新的深层结构,这种深层结构可以非线性地表征语音信号,并引入了转导式学习的思想,即在识别时联合训练数据与测试数据生成字典,因此同时利用了混合语音信... 

【文章来源】:国防科技大学湖南省 211工程院校 985工程院校

【文章页数】:65 页

【学位级别】:硕士

【部分图文】:

语音分离与语音识别关键技术研究


频谱图

生成过程,听觉感知,个人特征,听觉系统


图 2.1 频谱图系统是一个特殊的非线性系统,它响应不同频率征的提取上,人类听觉系统做得非常好,它不说话人的个人特征,这些都是现有的语音识别系统中能模拟人类听觉感知处理特点,就有可数(MelFrequencyCepstrumCoefficient,MFCC映射至基于听觉感知的梅尔非线性频谱中,进成过程如图所示:

循环神经网络,音分,方法,语音分离


国防科技大学研究生院专业学位硕士学位论文数据驱动的(data-driven)语音分离方法。该类方法利用一定量定的说话人或噪音环境进行语音分离,在过去的数十年中,该类的数据以及增加计算资源,取得了超越 CASA 以及语音增强方。目前较为有效的数据驱动的语音分离方法包括基于非负矩阵法[50],与基于深度神经网络的语音分离方法[51]。基于非负矩方法通过 NMF 学习多个声源的基矩阵,以表征不同声源的声学基矩阵得到一个词典,用于对混合语音进行分离,具体方法将在基于深度学习的语音分离方法,通过神经网络学习不同声源的声合语音的分离,如图 2 所示,语音信号的频域信号 作为输入,得到声源 1(Source 1)与声源 2(Source 2)的近似 与 ,将两者und-truth 语音信号 与 进行比较,根据一定的目标函数训练数小于某个阈值时,即可认为语音信号可以较好地被还原。

【参考文献】:
期刊论文
[1]基于GMM-HMM和深层循环神经网络的复杂噪声环境下的语音识别[J]. 刘旺玉,SHIRAISHI HIROSHI.  制造业自动化. 2016(05)
[2]DCT域维纳滤波语音增强[J]. 宁矿凤,王景芳.  计算机工程与应用. 2015(08)
[3]低信噪比下基于新型变步长LMS的自适应滤波算法[J]. 彭继慎,刘爽,安丽.  传感技术学报. 2013(08)
[4]基于谱减法和变步长LMS语音增强算法[J]. 徐文超,王光艳,耿艳香,白芳,费腾.  计算机工程与应用. 2015(01)
[5]基于语音特征聚类的HMM语音识别系统研究[J]. 姚敏锋,李心广,杨佳能.  微计算机信息. 2012(10)
[6]改进的小波变换HMM语音识别算法[J]. 洪淑月,施晓钟,徐皓.  浙江师范大学学报(自然科学版). 2011(04)
[7]基于压缩感知重构信号的说话人识别系统抗噪方法研究[J]. 叶蕾,郭海燕,杨震.  信号处理. 2010(03)
[8]窄带噪声下的子空间语音增强算法[J]. 陈国明,赵力,邹采荣.  应用科学学报. 2007(03)
[9]一种基于听觉掩蔽模型的语音增强算法[J]. 蔡汉添,袁波涛.  通信学报. 2002(08)



本文编号:3593040

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/3593040.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ba661***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com