基于HMM的可训练傣语语音合成系统
本文关键词:基于HMM的可训练傣语语音合成系统
更多相关文章: 语音合成 可训练 傣语 隐马尔可夫模型 STRAIGHT合成器
【摘要】:语音合成就是通过计算机将任意文字信息转换为可听懂且高自然度的声音信息进行输出的一种技术。近年来,随着数字信号处理技术和计算机技术的快速发展,语音合成技术发展也日益成熟,被广泛应用于人机语音通信中。云南是一个少数民族聚集的边疆省份,少数民族人口数约为1400多万。其中,有120多万傣族同胞使用傣语,且主要分布于德宏、保山、西双版纳一带。随着傣汉民族间的经济交流和文化交流日益频繁,傣语语音合成研究的重要性也就不言而喻。本文针对西双版纳新傣文,以开发傣语语音合成系统为目的,采用基于隐马尔可夫模型的可训练语音合成方法,对傣语语音合成系统进行了研究。论文的主要工作包括:1.阐述了基于HMM的语音合成基本原理,并在此基础上研究了傣语可训练语音合成系统的实现方案。2.根据西双版纳傣语语音特征,完成语音语料库的构建、音素列表的确定、单音子和三音子标注文件的获取和上下文属性和问题集的设计等傣语语音合成数据准备工作。3.采用HTK工具包,以均匀切分的1300句语音语料为初始训练数据,生成每个音子的HMM初始模型。通过多次循环训练和音子强制对齐,生成音子自动切分标注文件。4.基于STRAIGHT合成器的语音合成平台,对1300句已标注的傣语语句进行特征参数提取和HMM声学模型训练以及后端合成器的构建。采用训练好的声学模型对分析好的待合成语料进行HMM模型决策和参数预测,利用STRAIGHT合成器对预测参数进行语音波形的生成。实验结果表明,利用训练好的声学模型,能够合成出可懂度和自然度都可接受的傣语语句,说明本文采用的傣语合成方案以及音子自动标注方法具有可行性。
【关键词】:语音合成 可训练 傣语 隐马尔可夫模型 STRAIGHT合成器
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TN912.33
【目录】:
- 摘要3-4
- Abstract4-7
- 第一章 绪论7-13
- 1.1 语音合成概述7-11
- 1.1.1 什么是语音合成7-8
- 1.1.2 语音合成技术方法分类8-9
- 1.1.3 语音合成的发展历史与现状研究9-11
- 1.2 傣语语音合成概述11-12
- 1.2.1 傣语概述11
- 1.2.2 傣语语音合成现状11-12
- 1.3 作者的工作12
- 1.4 论文的组织12-13
- 第二章 基于HMM的可训练语音合成系统13-19
- 2.1 HMM模型简介13-16
- 2.1.1 离散马尔可夫链13
- 2.1.2 隐马尔可夫模型13-15
- 2.1.3 HMM三个基本问题15-16
- 2.2 HMM在语音合成中的应用16
- 2.3 合成系统框架16-19
- 2.3.1 合成系统介绍16-18
- 2.3.2 基于HMM的可训练语音合成的特点18-19
- 第三章 傣语语音合成数据准备19-41
- 3.1 语音语料库构建19-20
- 3.1.1 语料获取19-20
- 3.1.2 录制语音20
- 3.1.3 发音文稿校正20
- 3.2 音素列表确定20-25
- 3.3 标注文件获取25-39
- 3.3.1 单音子文件25-36
- 3.3.2 三音子文件36-39
- 3.4 上下文属性和问题集设计39-41
- 第四章 傣语语音合成系统构建41-51
- 4.1 环境和工具41-42
- 4.1.1 环境概述41
- 4.1.2 工具简介41-42
- 4.2 建模参数配置42
- 4.3 模型训练42-47
- 4.3.1 特征参数文件提取42-43
- 4.3.2 HMM模型训练43-47
- 4.4 合成语音47-48
- 4.5 实验结果48-51
- 第五章 总结和展望51-53
- 5.1 总结51-52
- 5.2 展望52-53
- 参考文献53-55
- 攻读硕士学位期间完成的科研成果55-56
- 致谢56
【相似文献】
中国期刊全文数据库 前10条
1 ;移动设备的又一增值服务──移动设备嵌入式语音合成系统[J];通信世界;2001年22期
2 ;科大讯飞新一代语音合成系统新特性[J];通讯世界;2005年06期
3 艾散·帕合提;蔡亚永;买尔丹·祖农;;语音合成系统的研究与应用[J];信息通信;2012年05期
4 朱军,翟宗起,柴立功,胡永生;智能语音合成系统的研究与实现[J];微机发展;1997年04期
5 吕庆莉,年玮;明日的播音明星 几可乱真的人工语音问世[J];国外科技动态;2003年03期
6 沈承,曹广益,朱新坚;低成本超大容量电子语音说明书系统的开发[J];微型机与应用;2001年03期
7 ;科大讯飞推出最新语音合成系统InterPhonic C&E v2.1[J];电信科学;2003年04期
8 ;新产品、新技术简讯[J];电子科技文摘;2003年12期
9 贾熹滨;尹宝才;李敬华;;语音同步的可视语音合成技术研究[J];北京工业大学学报;2005年06期
10 张鹏;;嵌入式语音合成系统的一种设计方案[J];中国水运(理论版);2006年03期
中国重要会议论文全文数据库 前10条
1 王仁华;;语音合成系统发展与最新进展[A];第九届全国人机语音通讯学术会议论文集[C];2007年
2 敖其尔;巩政;呼日勒巴特尔;王小喻;;蒙古语音合成系统[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 董世伟;张家,
本文编号:923446
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/923446.html