基于声道谱参数的语音转换算法研究
本文关键词:基于声道谱参数的语音转换算法研究
更多相关文章: 语音转换 声道谱转换 高斯混合模型 人工神经网络 模糊K均值聚类 小波变换 自适应粒子群
【摘要】:语音转换技术是在保留源说话人语义信息不变的前提下,将源说话人的个性特征进行转换,使之听起来像目标说话人的声音。本文主要研究基于声道谱特征参数的语音转换技术,主要内容包括:(1)针对传统的高斯混合模型没有描述说话人间的非线性关系以及易出现过平滑导致转换语音质量不理想的现象,提出基于高斯混合模型与人工神经网络的混合模型语音转换算法,采用径向基函数神经网络对高斯混合模型的均值参数进行转换,建立新的转换规则。主观和客观测试表明,该方法提高了经典语音转换系统的性能,改进了转换语音的音质。(2)针对运用高斯混合模型进行语音转换时容易出现的过平滑现象,本文将多分辨率小波分析用于语音转换中,并在对特征参数进行多分辨率小波分析前,先进行模糊K均值聚类,以提高转换精度与转换速度。仿真实验表明:该算法在提高转换速度的前提下,提高了转换语音的清晰度与可懂度。(3)针对运用传统方法训练径向基函数神经网络出现的收敛速度慢、易陷入局部最优、泛化性能不佳的问题,提出用自适应粒子群优化算法训练径向基函数神经网络进行语音特征建模,获取说话人谱包络的映射关系。主观和客观实验表明:该算法能够降低转换语音的频谱失真,提高转换语音与目标语音的相似性。
【关键词】:语音转换 声道谱转换 高斯混合模型 人工神经网络 模糊K均值聚类 小波变换 自适应粒子群
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TN912.3
【目录】:
- 摘要4-5
- Abstract5-8
- 专用术语注释表8-9
- 第一章 绪论9-14
- 1.1 语音转换的研究背景9
- 1.2 语音转换的研究意义9-10
- 1.3 语音转换的发展历程10-12
- 1.4 语音转换的主要研究内容12
- 1.5 论文的结构安排12-14
- 第二章 语音转换技术的相关原理概述14-24
- 2.1 语音信号的产生原理14-15
- 2.2 语音信号的分析与合成模型15-16
- 2.2.1 线性预测编码模型15-16
- 2.2.2 谐波加噪声模型16
- 2.2.3 STRAIGHT模型16
- 2.3 常用的特征参数及其提取16-17
- 2.3.1 线性预测系数17
- 2.3.2 线谱频率参数17
- 2.4 特征参数的对齐17-19
- 2.4.1 平行特征参数的对齐18
- 2.4.2 非平行特征参数的对齐18-19
- 2.4.3 无特征参数的对齐19
- 2.5 说话人特征参数的转换算法19-22
- 2.5.1 谱特征参数的转换19-21
- 2.5.2 韵律特征参数的转换21-22
- 2.6 语音转换的评价指标22-23
- 2.6.1 主观评价22
- 2.6.2 客观评价22-23
- 2.7 本章小结23-24
- 第三章 基于GMM与ANN的混合语音转换算法研究24-30
- 3.1 引言24
- 3.2 高斯混合模型24-25
- 3.3 人工神经网络模型25-26
- 3.4 基于GMM与ANN的混合语音转换26
- 3.5 实验与仿真26-29
- 3.5.1 实验条件27
- 3.5.2 主观评价27-28
- 3.5.3 客观评价28-29
- 3.6 本章小结29-30
- 第四章 基于聚类与小波分析的频谱转换系统30-39
- 4.1 引言30
- 4.2 模糊K均值聚类算法30-32
- 4.3 小波分析32-34
- 4.4 基于模糊K均值聚类与小波分析的频谱转换34-35
- 4.5 实验与仿真35-38
- 4.5.1 数据库36
- 4.5.2 主观评价36-37
- 4.5.3 客观评价37-38
- 4.6 本章小结38-39
- 第五章 基于自适应粒子群优化RBF神经网络的语音转换39-47
- 5.1 引言39
- 5.2 算法描述39-43
- 5.2.1 径向基函数神经网络的结构及其参数分析40-41
- 5.2.2 自适应粒子群算法41-42
- 5.2.3 基于自适应粒子群优化的径向基函数神经网络42-43
- 5.3 实验与仿真43-45
- 5.3.1 数据库43
- 5.3.2 主观评价43-44
- 5.3.3 客观评价44-45
- 5.4 本章小结45-47
- 第六章 总结与展望47-49
- 6.1 总结47-48
- 6.2 展望48-49
- 参考文献49-52
- 附录1 攻读硕士学位期间撰写的论文52-53
- 附录2 攻读硕士学位期间参加的科研项目53-54
- 致谢54
【相似文献】
中国期刊全文数据库 前10条
1 张敏,赵猛,贾云得,王俊;基于自适应高斯混合模型的图像稳定方法[J];北京理工大学学报;2004年10期
2 赵征鹏,杨鉴;基于高斯混合模型的非母语说话人口音识别[J];计算机工程;2005年06期
3 侯建华;熊承义;田金文;柳健;;图像小波系数的高斯混合模型研究[J];计算机应用;2006年03期
4 顾明亮;马勇;;基于高斯混合模型的汉语方言辨识系统[J];计算机工程与应用;2007年03期
5 袁礼海;李钊;宋建社;;利用高斯混合模型实现概率密度函数逼近[J];无线电通信技术;2007年02期
6 张超琼;苗夺谦;岳晓冬;;基于高斯混合模型的语音性别识别[J];计算机应用;2008年S2期
7 许晓东;熊卫斌;朱士瑞;;基于高斯混合模型的流量矩阵估算研究[J];计算机工程;2009年14期
8 王岐学;钱盛友;赵新民;;基于差分特征和高斯混合模型的湖南方言识别[J];计算机工程与应用;2009年35期
9 韩晓峰;;基于自回归的高斯混合模型[J];科技风;2009年23期
10 马超;张政石;;基于二维高斯混合模型的驾驶行为分析[J];硅谷;2011年05期
中国重要会议论文全文数据库 前10条
1 骆俊;马尽文;;高斯混合模型的遗传分基融合算法[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
2 廖频;沈理;;基于高斯混合模型的人脸图象识别研究[A];2001年中国智能自动化会议论文集(上册)[C];2001年
3 马尽文;何学锋;;高斯混合模型的数据尺度可压缩参数学习算法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
4 瞿俊;姜青山;董槐林;;基于高斯混合模型的层次聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 蔡念;郭文婷;陈世文;潘晴;;融合高斯混合模型和小波变换的运动目标检测[A];第十五届全国图象图形学学术会议论文集[C];2010年
6 龙艳花;郭武;戴礼荣;;一种应用于SVM说话者确认系统的新型序列核[A];第九届全国人机语音通讯学术会议论文集[C];2007年
7 刘李漫;陶文兵;田金文;;融合多高斯混合模型与Graph Cuts优化技术的目标自动检测方法[A];第十五届全国图象图形学学术会议论文集[C];2010年
8 康永国;双志伟;陶建华;张维;徐波;;高斯混合模型和码本映射相结合的语音转换算法[A];第八届全国人机语音通讯学术会议论文集[C];2005年
9 应冬文;颜永红;付强;国雁萌;;基于约束高斯混合模型的噪声功率谱估计[A];2010年通信理论与信号处理学术年会论文集[C];2010年
10 唐英干;刘东;关新平;;基于高斯混合模型的多分辨率图像分割[A];第十二届全国图象图形学学术会议论文集[C];2005年
中国博士学位论文全文数据库 前5条
1 王益文;复杂网络节点影响力模型及其应用[D];浙江大学;2015年
2 陈雪峰;图像高斯混合模型的判别学习方法[D];北京理工大学;2009年
3 赖裕平;非高斯混合模型的变分学习算法研究[D];北京邮电大学;2014年
4 刘辉;miRNA靶标预测的系统生物学方法研究[D];中国矿业大学;2009年
5 陶建斌;贝叶斯网络模型在遥感影像分类中的应用方法研究[D];武汉大学;2010年
中国硕士学位论文全文数据库 前10条
1 范苗;基于高斯混合模型的时变过程软测量建模[D];浙江大学;2015年
2 许莉薇;基于高斯混合模型林业信息文本分类的技术研究[D];东北林业大学;2015年
3 车滢霞;约束条件下的结构化统计声学模型及非平行语料语音转换[D];苏州大学;2015年
4 张晓红;基于候选生成的猫脸检测[D];哈尔滨工业大学;2015年
5 付娜;基于视频的运动人体行为捕捉算法研究[D];北京理工大学;2015年
6 王炳辉;基于层次贝叶斯自适应稀疏的高斯混合模型[D];大连理工大学;2015年
7 邱藤;基于高斯混合模型的EM算法及其应用研究[D];电子科技大学;2015年
8 张小林;基于高斯混合模型和非负矩阵分解的复杂网络社区检测[D];西安电子科技大学;2014年
9 姚绍芹;基于声道谱参数的语音转换算法研究[D];南京邮电大学;2015年
10 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
,本文编号:794866
本文链接:https://www.wllwen.com/kejilunwen/wltx/794866.html