超帧特征空间下基于深度置信网络的语音转换
发布时间:2017-10-31 23:26
本文关键词:超帧特征空间下基于深度置信网络的语音转换
更多相关文章: 语音转换 深度置信网络 短时谱深度特征 超帧
【摘要】:语音转换的目的是在保持语义内容不变的前提下,将源说话人语音的个性特征改变,转换成具有目标说话人个性特征的语音,使得听起来像目标说话人的发音。语音转换技术的研究是语音信号处理领域一个比较重要的分支,它可以促进语音合成、语音编码等领域的研究,同时也有着广泛的应用前景。目前比较主流的语音转换方法是基于高斯混合模型(GMM)的转换方法,该方法虽然可以取得较好的语音转换效果,但是由于GMM方法假设各个语音参数帧之间是统计独立,忽略了语音相邻帧之间的相关性,从而使转换后的语音有一定的不连续,其次,由于传统的GMM模型在语音的参数化表达下对特征矢量进行加权平均,必然会引起参数的过平滑。本文提出了一种超帧特征空间下基于深度置信网络(DBN-Sf,Deep Belief Nets in Super-frame feature space)的语音转换方法,它是将深度置信网络构成的深度神经网络作为回归模型来映射源和目标说话人频谱参数之间的非线性关系。首先利用STRAIGHT提取说话人的基频和短时谱参数,从短时谱参数中求得对应的LPCC参数,利用动态时间规整将源和目标说话人的特征参数进行对齐,通过扩展源说话人当前的语音帧来构建超帧信息作为网络的输入,目标说话人对应的当前帧作为网络的输出,经训练得到短时谱转换函数。实验结果显示,使用该方法的转换语音在谱失真、目标倾向性和语音质量等方面均优于传统的高斯混合模型方法,转换语音的平均谱失真度相对于传统的GMM方法降低了9.5%。
【关键词】:语音转换 深度置信网络 短时谱深度特征 超帧
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.3
【目录】:
- 中文摘要4-5
- Abstract5-8
- 第一章 绪论8-12
- 1.1 语音转换的定义8-9
- 1.2 语音转换的研究意义及应用9
- 1.3 课题研究现状分析9-10
- 1.4 论文的主要研究内容10-12
- 第二章 语音转换理论基础12-30
- 2.1 语音信号概述12-16
- 2.1.1 语音信号的发音原理12-13
- 2.1.2 语音个性特征13-14
- 2.1.3 语音信号产生的数学模型14-16
- 2.2 语音信号分析16-24
- 2.2.1 语音信号的预处理16-21
- 2.2.2 特征参数的分析与提取21-23
- 2.2.3 语谱图分析23-24
- 2.3 语音转换系统的基本原理24-25
- 2.4 STRAIGHT语音分析与合成模型25-27
- 2.5 语音转换效果的评价方法27-30
- 2.5.1 主观评价27-28
- 2.5.2 客观评价28-30
- 第三章 基于高斯混合模型的语音转换系统30-36
- 3.1 系统构成30-31
- 3.2 语音特征参数的时间规整31-33
- 3.3 高斯混合模型33-34
- 3.3.1 高斯混合模型的基本概念33
- 3.3.2 高斯混合模型的训练及参数设置33-34
- 3.4 转换函数34-36
- 第四章 基于深度置信网络的语音转换36-46
- 4.1 限制玻尔兹曼机(RBM)36-38
- 4.2 深度置信网络38-39
- 4.3 基于短时谱深度特征的语音转换39-42
- 4.3.1 系统构成39-40
- 4.3.2 转换函数40-42
- 4.4 超帧特征空间下基于深度置信网络的语音转换42-46
- 4.4.1 语音转换系统构成43-44
- 4.4.2 网络的训练44-46
- 第五章 语音转换实验及分析46-53
- 5.1 语料库描述及参数设置46-48
- 5.2 客观评价48-49
- 5.3 主观评价49-50
- 5.4 语谱图分析50-53
- 第六章 总结与展望53-55
- 6.1 总结53
- 6.2 展望53-55
- 参考文献55-59
- 攻读硕士学位期间公开发表的论文59-60
- 致谢60-61
【相似文献】
中国期刊全文数据库 前5条
1 张楠;韩笑蕾;张洋;;基于MELP算法的超帧结构状态统计及改进算法研究[J];电脑知识与技术;2012年16期
2 姚钢;;基于IEEE802.15.4B规范超帧机制下的230MHz无线专网系统改造方案[J];数字技术与应用;2011年02期
3 范书瑞;赵燕飞;孙鹤旭;;基于网络演算的LR-WPANs端到端延迟界限[J];江南大学学报(自然科学版);2012年04期
4 王平;刘其琛;王恒;李同波;;一种适用于ISA100.11a工业无线网络的通信调度方法[J];仪器仪表学报;2011年05期
5 ;[J];;年期
中国重要会议论文全文数据库 前1条
1 陈进武;;浅谈PHS网络的寻呼区划分[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
中国硕士学位论文全文数据库 前3条
1 叶伟;超帧特征空间下基于深度置信网络的语音转换[D];苏州大学;2016年
2 党魁;WirelessHART网络调度及管理方案的研究[D];浙江大学;2012年
3 陈善涛;基于ZigBee的移动目标追踪系统QoS改进[D];浙江大学;2011年
,本文编号:1124249
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/1124249.html