采用STRAIGHT模型和深度信念网络的语音转换方法
发布时间:2017-04-17 19:12
本文关键词:采用STRAIGHT模型和深度信念网络的语音转换方法,由笔耕文化传播整理发布。
【摘要】:提出一种将STRAIGHT模型和深度信念网络DBN相结合实现语音转换的方式。首先,通过STRAIGHT模型提取出源说话人和目标说话人的语音频谱参数,用提取的频谱参数分别训练两个DBN得到语音高阶空间的个性特征信息;然后,用人工神经网络ANN将两个具有高阶特征的空间连接并进行特征转换;最后,用基于目标说话人数据训练出的DBN来对转换后的特征信息进行逆处理得到语音频谱参数,并用STRAIGHT模型合成具有目标说话人个性化特征的语音。实验结果表明,采用此种方式获得的语音转换效果要比传统的采用GMM实现语音转换更好,转换后的语音音质和相似度与目标语音更接近。
【作者单位】: 西安建筑科技大学信息与控制工程学院;
【关键词】: 语音转换 STRAIGHT模型 深度信念网络 高阶空间
【基金】:住房城乡建设部科学技术项目计划(2016-R2-045) 西安市碑林区2014年科技计划项目(GX1412)
【分类号】:TN912.3
【正文快照】: 1引言语音转换就是在语义保持不变的前提下,改动语音的个性特点,使一个人的语音听起来像另外一个人的语音。当前国外的学者在语音转换方面进行了很多研究,比较经典的方法有:采用隐马尔可夫模型HMM(Hidden Markov Model)[1]、频谱弯折FW(Frequency Warping)[2]、码书映射CM(Co-
【相似文献】
中国期刊全文数据库 前2条
1 张正军;杨卫英;陈赞;;基于STRAIGHT模型和人工神经网络的语音转换[J];电声技术;2010年09期
2 ;[J];;年期
本文关键词:采用STRAIGHT模型和深度信念网络的语音转换方法,,由笔耕文化传播整理发布。
本文编号:314107
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/314107.html