英语文语转换系统中的ToBl韵律自动标注方法与实现
本文关键词:英语文语转换系统中的ToBl韵律自动标注方法与实现,,由笔耕文化传播整理发布。
【摘要】:随着互联网浪潮的汹涌之势扑面而来,语音合成技术也趁着站在风口的机会实现了快速的成长。作为人工智能的一部分,语音合成技术的未来方向必然是让机器语音合成效果达到人类的说话水平。那么作为语音合成中关键的一项技术,即韵律的表达效果也会越来越被重视。论文将就ToBI韵律自动标注展开讨论和研究,并展示加载了自动标注后的英文TTS效果。论文的具体工作如下:首先,论文将对语音合成技术的背景以及历史发展进行阐述,然后分别介绍各种语音合成方法,其中包括目前最主流的两种合成方式,即基于HMM模型的参数合成以及基于大语料库的拼接合成。论文在第二章对于韵律标注的体系ToBI进行详细介绍。因为之后的预测正确率和合成效果均是建立在对ToBI韵律标注体系进行预测的基础上的。其次,论文会着重描述C4.5预测树算法、最大熵算法和条件随机场算法,并在具体的实现过程中,介绍这几种模型训练和测试方法。通过对不同韵律模型的分析对比,我们可以用不同的模型来对韵律进行自动标注,并加载进入英文的TTS。最后,论文将分别测试出几个不同模型的预测效果,通过不同的测试方式我们可以得到一个直接的数据结果。结果显示,论文所使用的C4.5决策树和CRF模型能够有效对ToBI韵律体系进行预测标注。当加入韵律预测模型后,我们对英文TTS系统合成的声音做了一个主观MOS测听实验,相比于之前的MOS得分,新的句子提升0.31,在韵律上有一个明显的提升。这进一步地论证论文中采取的实验思路和方法具备一定的可靠性。此外,论文对实验结果进行总结,提出在ToBI自动标注上仍待优化的几个部分,并对语音合成在ToBI韵律预测上的一些展望和建议。
【关键词】:语音合成 ToBI韵律标注 C4.5决策树 CRF模型 韵律预测
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.33
【目录】:
- 摘要3-4
- Abstract4-8
- 第一章 绪论8-18
- 1.1 语音合成概述9-11
- 1.1.1 什么是语音合成9-10
- 1.1.2 语音合成发展历程10-11
- 1.2 语音产生机理11-13
- 1.3 语音合成方法13-16
- 1.3.1 物理机理的语音合成13
- 1.3.2 源-滤波器的语音合成13-14
- 1.3.3 基于波形拼接的语音合成14-15
- 1.3.4 基于HMM模型的参数语音合成15-16
- 1.4 论文研究思路以及主要工作16
- 1.5 论文的组织结构16-18
- 第二章 ToBI韵律标注体系18-30
- 2.1 概述18-21
- 2.2 标注方法21-26
- 2.2.1 拼写标注21
- 2.2.2 层次标注21-23
- 2.2.3 音调标注23-26
- 2.2.4 注释标注26
- 2.2.5 基频最高点HIFO的标注26
- 2.3 标注举例26-28
- 2.4 本章小结28-30
- 第三章 韵律的自动标注和预测30-42
- 3.1 机器学习30-31
- 3.2 基于决策树的韵律标注31-35
- 3.2.1 基于ID3决策树的韵律标注31
- 3.2.2 基于C4.5决策树的韵律标注31-34
- 3.2.3 ID3算法与C4.5算法的比较34-35
- 3.3 基于ME模型的边界信息和语调预测35-38
- 3.4 基于CRF的韵律预测38-41
- 3.5 本章小结41-42
- 第四章 ToBI韵律预测的实现42-54
- 4.1 语料库数据准备42
- 4.2 基于C4.5决策树的韵律预测42-46
- 4.3 基于最大墒模型的韵律预测46-48
- 4.4 基于CRF模型的韵律预测48-50
- 4.5 实验结果与分析50-53
- 4.5.1 C4.5预测51
- 4.5.2 ME+CRF预测方法51-53
- 4.6 本章小结53-54
- 第五章 ToBI自动标注在TTS中的应用54-60
- 5.1 ToBI自动标注在TTS中的应用流程54-56
- 5.2 TTS系统的评测方法56-58
- 5.3 实验结果与分析58
- 5.4 本章小结58-60
- 第六章 总结和展望60-62
- 6.1 总结60
- 6.2 展望60-62
- 参考文献62-66
- 致谢66-67
【相似文献】
中国期刊全文数据库 前10条
1 周海涛;;语音合成中多音字识别的实现[J];科技资讯;2008年11期
2 彭腾;孙萍;;基于C#语音合成的实现[J];电脑编程技巧与维护;2010年12期
3 张世平;;会说四种话的语音合成卡——声威一号[J];今日电子;1993年01期
4 赵建洋;;一种高效语音合成方法[J];电子技术;1993年08期
5 马义德,张新国,罗长印;语音合成电路在我国的应用前景[J];电子技术;1994年12期
6 郝杰;语音合成:引领“耳朵经济”[J];中国电子商务;2001年Z2期
7 罗三定,贾建华,沙莎;基于波形音频段处理的中文语音合成研究[J];电脑与信息技术;2002年01期
8 ;国内语音合成领域专利技术发展趋势[J];电子知识产权;2003年10期
9 周洁,赵力,邹采荣;情感语音合成的研究[J];电声技术;2005年10期
10 王永生;柴佩琪;曾令平;;英语语音合成中基于约束树的音节切分算法[J];微型电脑应用;2005年11期
中国重要会议论文全文数据库 前10条
1 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 徐俊;蔡莲红;吴志勇;;多语种语音合成平台的设计与实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 陶建华;董宏辉;许晓颖;;情感语音合成的关键技术分析[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
5 刘东华;冯静;力梅;;深圳市新一代“12121”语音合成业务系统[A];中国气象学会2007年年会气象软科学论坛分会场论文集[C];2007年
6 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
7 邹煜;何伟;侯敏;滕永林;朱维彬;;面向语音合成的新闻播报语音库构建及其特殊韵律结构[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 吴志勇;蔡莲红;蒙美玲;;可视语音合成中基于音视频关联模型的视位参数优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 桂运安;中科大11项语音合成指标世界第一[N];安徽日报;2014年
2 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年
3 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年
4 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年
5 ;嵌入式语音合成平台[N];计算机世界;2002年
6 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年
7 ;新型语音合成软件面世[N];人民邮电;2008年
8 炎黄新星公司供稿;炎黄之声SinoSonic[N];计算机世界;2002年
9 刘权;语音合成融入证券客服[N];中国计算机报;2003年
10 ;语音产品走向开放式架构[N];中国计算机报;2004年
中国博士学位论文全文数据库 前10条
1 高莹莹;面向情感语音合成的言语情感建模研究[D];北京交通大学;2016年
2 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年
3 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年
4 苏庄銮;情感语音合成[D];中国科学技术大学;2006年
5 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
6 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
7 蔡明琦;融合发音机理的统计参数语音合成方法研究[D];中国科学技术大学;2015年
8 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
9 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年
10 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
中国硕士学位论文全文数据库 前10条
1 王泽勋;多层次韵律和短时谱同步变换的情感语音合成[D];苏州大学;2015年
2 熊林云;基于ARM Cortex-M3的语音合成软件系统设计与实现[D];电子科技大学;2014年
3 章琴;基于HMM的中文情感语音合成的研究[D];合肥工业大学;2014年
4 李冰洁;基于声韵母的嵌入式语音合成[D];北京交通大学;2016年
5 李焕君;个性化语音合成在船舶导航系统中应用研究[D];大连海事大学;2016年
6 冯欢;基于HMM的歌词到歌声转换的研究[D];西北师范大学;2015年
7 王海燕;汉藏双语跨语言统计参数语音合成的研究[D];西北师范大学;2015年
8 孙晓辉;结合听感度量的语音合成方法研究[D];中国科学技术大学;2016年
9 李翔凰;基于HMM-RBM的蒙古语语音合成研究[D];内蒙古大学;2016年
10 王雨蒙;英语文语转换系统中的ToBl韵律自动标注方法与实现[D];云南大学;2016年
本文关键词:英语文语转换系统中的ToBl韵律自动标注方法与实现,由笔耕文化传播整理发布。
本文编号:461438
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/461438.html