基于HMM的单元挑选语音合成方法研究

发布时间:2017-12-09 23:09

  本文关键词:基于HMM的单元挑选语音合成方法研究


  更多相关文章: 语音合成 隐马尔可夫模型 基音同步叠加 波形拼接 自然度


【摘要】:语音合成即文语转换(TTS)技术,是智能语音交互方式的重要分支。在当今这个快速发展的信息化社会中,人们普遍追求智能化的交互方式,其中语音合成技术已经在一些应用中广泛使用,如智能汽车的导航系统、电子设备中的语音助手、盲人阅读器等,这些应用为人类的生活带来无限方便。毋庸置疑,语音合成将在人们未来的生活中扮演非常重要的角色,但目前该技术在合成自然度方面与人们期望的目标仍然有一定差距,影响了语音合成技术的进一步发展,所以本文在研究语音合成的基础上,对传统的方法进行改进以提高合成语音的自然度。目前比较流行的两种语音合成方法分别是:基于统计建模的语音合成和基于波形拼接的语音合成,这两种方法各有优缺点,其中波形拼接合成方法得到的语音比较自然,非常接近人的原始声音,而基于统计建模的合成方法具有快速构建系统,合成效果稳定,存储空间较小等优点,所以本文深入研究这两种合成方法,结合二者的优点进行基于HMM的单元挑选语音合成方法的研究。在单元挑选准则方面,传统方法采用以帧为单位挑选语音帧单元,容易导致语音的连续性下降,同时算法的高复杂度也为实际应用带来不便,针对该不足本文将增大挑选单元的尺度,采用以声韵母为单位进行单元挑选,可以改善语音不连续的问题;在单元拼接过程中深入研究PSOLA算法,对传统自相关函数法基音标注产生的误判进行改进,采用中心削波函数与自相关函数相结合的方法实现基音提取,提高基音标注的准确度,此外为了简化计算量以便提高程序的运行效率,将中心削波函数改进为三电平函数;在单元拼接时由于拼接点之间出现的高频噪声对合成语音自然度影响较大,所以采取在拼接单元之间添加相应的过渡单元来平滑拼接处的不连续,以及在拼接过程中采用平滑算法进一步平滑处理,旨在提高合成语音的流畅性及自然度。文章最后将基于HMM的单元挑选语音合成系统同基于波形拼接语音合成系统以及基于HMM参数语音合成系统作对比,并分别从主观评价和客观分析上对三个系统作定性以及定量比较,结果表明由基于HMM的单元挑选语音合成系统得到的语音自然度有所提高。
【学位授予单位】:西安工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TN912.33

【相似文献】

中国期刊全文数据库 前10条

1 郑骐;情感语音合成——研究现状与发展[J];宁波广播电视大学学报;2005年03期

2 周海涛;;语音合成中多音字识别的实现[J];科技资讯;2008年11期

3 彭腾;孙萍;;基于C#语音合成的实现[J];电脑编程技巧与维护;2010年12期

4 张世平;;会说四种话的语音合成卡——声威一号[J];今日电子;1993年01期

5 赵建洋;;一种高效语音合成方法[J];电子技术;1993年08期

6 马义德,,张新国,罗长印;语音合成电路在我国的应用前景[J];电子技术;1994年12期

7 郝杰;语音合成:引领“耳朵经济”[J];中国电子商务;2001年Z2期

8 罗三定,贾建华,沙莎;基于波形音频段处理的中文语音合成研究[J];电脑与信息技术;2002年01期

9 ;国内语音合成领域专利技术发展趋势[J];电子知识产权;2003年10期

10 周洁,赵力,邹采荣;情感语音合成的研究[J];电声技术;2005年10期

中国重要会议论文全文数据库 前10条

1 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

2 徐俊;蔡莲红;吴志勇;;多语种语音合成平台的设计与实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

3 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年

4 陶建华;董宏辉;许晓颖;;情感语音合成的关键技术分析[A];第六届全国现代语音学学术会议论文集(下)[C];2003年

5 刘东华;冯静;力梅;;深圳市新一代“12121”语音合成业务系统[A];中国气象学会2007年年会气象软科学论坛分会场论文集[C];2007年

6 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

7 邹煜;何伟;侯敏;滕永林;朱维彬;;面向语音合成的新闻播报语音库构建及其特殊韵律结构[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

8 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

9 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

10 吴志勇;蔡莲红;蒙美玲;;可视语音合成中基于音视频关联模型的视位参数优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年

中国重要报纸全文数据库 前10条

1 记者 桂运安;中科大11项语音合成指标世界第一[N];安徽日报;2014年

2 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年

3 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年

4 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年

5 ;嵌入式语音合成平台[N];计算机世界;2002年

6 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年

7 ;新型语音合成软件面世[N];人民邮电;2008年

8 炎黄新星公司供稿;炎黄之声SinoSonic[N];计算机世界;2002年

9 刘权;语音合成融入证券客服[N];中国计算机报;2003年

10 ;语音产品走向开放式架构[N];中国计算机报;2004年

中国博士学位论文全文数据库 前10条

1 高莹莹;面向情感语音合成的言语情感建模研究[D];北京交通大学;2016年

2 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年

3 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年

4 苏庄銮;情感语音合成[D];中国科学技术大学;2006年

5 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年

6 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年

7 蔡明琦;融合发音机理的统计参数语音合成方法研究[D];中国科学技术大学;2015年

8 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年

9 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年

10 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年

中国硕士学位论文全文数据库 前10条

1 王泽勋;多层次韵律和短时谱同步变换的情感语音合成[D];苏州大学;2015年

2 熊林云;基于ARM Cortex-M3的语音合成软件系统设计与实现[D];电子科技大学;2014年

3 章琴;基于HMM的中文情感语音合成的研究[D];合肥工业大学;2014年

4 李冰洁;基于声韵母的嵌入式语音合成[D];北京交通大学;2016年

5 李焕君;个性化语音合成在船舶导航系统中应用研究[D];大连海事大学;2016年

6 冯欢;基于HMM的歌词到歌声转换的研究[D];西北师范大学;2015年

7 王海燕;汉藏双语跨语言统计参数语音合成的研究[D];西北师范大学;2015年

8 孙晓辉;结合听感度量的语音合成方法研究[D];中国科学技术大学;2016年

9 李翔凰;基于HMM-RBM的蒙古语语音合成研究[D];内蒙古大学;2016年

10 王雨蒙;英语文语转换系统中的ToBl韵律自动标注方法与实现[D];云南大学;2016年



本文编号:1272189

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1272189.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e51a6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com