基于深度学习的目标语音信号提取算法
发布时间:2021-08-05 23:36
说话人语音提取是说话人语音分离领域中的一部分,有监督学习的情况下,针对从单声道观测语音信号中提取目标说话人语音,本文提出了基于注意机制的说话人语音提取算法,该算法充分利用已知目标源语音信号的辅助信息,针对性的提取我们想要的目标语音信号。近年来随着深度学习的发展,深度学习模式已广泛应用于图像和语音信号的处理领域中。本文主要研究了基于深度学习的注意机制目标说话人语音的提取。论文主要贡献如下:1.构建两个深度神经网络:一个时频掩蔽估计网络、一个说话人信息提取的辅助网络。将混合语音和不同于混合语音中的目标说话人额外语音分别作为两个网络的输入。针对辅助网络对目标说话人额外语音进行目标说话人的信息参数提取,采用了语音序列汇总法和带有注意功能的语音序列汇总法两种信息参数提取方法。将辅助网络输出的信息参数作为权重向量引入到掩蔽估计网络的隐藏层中,对其每一个单元的输出按照权重进行缩放,得到对应于目标说话人的内部嵌入向量。最终利用目标说话人对应的嵌入向量在掩蔽估计网络中传递训练并估计目标说话人的掩蔽。2.构建语音分离和提取的统一神经网络框架,提出了基于嵌入式注意机制的目标说话人语音提取算法。首先该算法将基...
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图2.3?Xu等人提出的基于DNN的语音分离网络模型[44]??目前研宄学者也提出了很多以DNN基础的改进的语音分离方法
?第2章语音分离基本理论???t?????g一、??i???H?/w,.,(m?Hr)?k??斗??—?!,wx)?k???±,??????,w丨(m',H:)?\??、W!???H?/w?K=H:)?k??\?w°??m,?H:??图2.4?Jonathan?Le?Roux等人提出NMF和DNN结合的语音分离网络模型[M]??14??
?第3章基于注意机制DNNs的目标人语音提取算法???第3章基于注意机制DNNs的目标人语音提取算法??本章主要研宄特定单声道目标说话人的分离,同时利用了目标说话人辅助??语音信息(非训练目标说话人语音),将更多的注意力放到特定目标说话人上。??首先对混合语音信号进行短时傅里叶变换,并求其幅度谱特征和对应的相位,??以同样的方法求出目标说话人辅助语音的幅度谱。然后将混合语音信号的幅度??谱和辅助语音幅度谱分别作为掩蔽预测网络和辅助网络的输入,利用辅助网络??的输出指导掩蔽预测网络的训练。最后将估计的时频掩蔽用于目标说话人的提??龋分离框架如图3.1所示。??目标说话人语音?相位??''?V??干扰¥话人语音?iTiiri? ̄? ̄?rziri?时频掩蔽 ̄?fTTir??混合信号H?求幅麟->???元麵?一?一-4*??f声?——?提酬标人语音??崎.? ̄—>?求幅度谱-??辅删络??目标说话人辅??助语音?I注意机制??图3.1注意机制下的DNNs分离系统??3.1深度神经网的原理??根据人们对语音分离的理解,语音分离其实可以看成一个分类问题,传统??浅层模型的语音分离算法,首先需要提取语音特征,将语音信号转换成易于分??类的表达形式数据。如图3.2所示,同种形状的图形表示同类数据。??16??
本文编号:3324646
【文章来源】:南昌大学江西省 211工程院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图2.3?Xu等人提出的基于DNN的语音分离网络模型[44]??目前研宄学者也提出了很多以DNN基础的改进的语音分离方法
?第2章语音分离基本理论???t?????g一、??i???H?/w,.,(m?Hr)?k??斗??—?!,wx)?k???±,??????,w丨(m',H:)?\??、W!???H?/w?K=H:)?k??\?w°??m,?H:??图2.4?Jonathan?Le?Roux等人提出NMF和DNN结合的语音分离网络模型[M]??14??
?第3章基于注意机制DNNs的目标人语音提取算法???第3章基于注意机制DNNs的目标人语音提取算法??本章主要研宄特定单声道目标说话人的分离,同时利用了目标说话人辅助??语音信息(非训练目标说话人语音),将更多的注意力放到特定目标说话人上。??首先对混合语音信号进行短时傅里叶变换,并求其幅度谱特征和对应的相位,??以同样的方法求出目标说话人辅助语音的幅度谱。然后将混合语音信号的幅度??谱和辅助语音幅度谱分别作为掩蔽预测网络和辅助网络的输入,利用辅助网络??的输出指导掩蔽预测网络的训练。最后将估计的时频掩蔽用于目标说话人的提??龋分离框架如图3.1所示。??目标说话人语音?相位??''?V??干扰¥话人语音?iTiiri? ̄? ̄?rziri?时频掩蔽 ̄?fTTir??混合信号H?求幅麟->???元麵?一?一-4*??f声?——?提酬标人语音??崎.? ̄—>?求幅度谱-??辅删络??目标说话人辅??助语音?I注意机制??图3.1注意机制下的DNNs分离系统??3.1深度神经网的原理??根据人们对语音分离的理解,语音分离其实可以看成一个分类问题,传统??浅层模型的语音分离算法,首先需要提取语音特征,将语音信号转换成易于分??类的表达形式数据。如图3.2所示,同种形状的图形表示同类数据。??16??
本文编号:3324646
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3324646.html