当前位置:主页 > 科技论文 > 网络通信论文 >

基于HMM的中文情感语音合成的研究

发布时间:2019-10-12 13:47
【摘要】:语音是人类最直接、最有效的交流方式。随着计算机智能和情感计算的发展,人们对语音处理技术的要求越来越高。本文针对多样化的语音,提出了基于HMM的语音合成方法,实现了系统的自动训练与构建。在此基础上,研究了语音的情感分类方法以及情感语音的特征分析,通过分析情感语音在基频、时长、能量和上下文等方面的特征,总结出情感语音和中性语句之间的关联。为了合成出高质量的情感语句,特别引入了PAD三维情感模型,将离散化的情感语音扩展为可计算的量化语音。最后,通过语音合成器合成目标情感语音。本文采用PAD情感状态模型分析语音的情感特征,这为今后语音的情感处理研究提供了理论依据。通过Boosting-GMM算法来预测建模,为后续的目标情感语音合成奠定了良好的实验基础和分析依据。本文主要研究工作和研究成果如下:1.提出一种基于统计声学模型的语音合成方法,建立了一个完整的可训练的语音合成系统框架。该系统对输入的语音数据进行声学参数建模,并以训练得到的统计模型为基础构建相应的合成系统,能够很好地满足目前对多样化和高表现力的语音合成需求。2.采用了PAD情感状态模型对情感语音特征参数进行了定量分析,得出不同情感状态与PAD三个维度之间的映射关系,为后续的目标情感语音合成提供了理论基础,提高了合成语音的音质。3.通过Boosting-GMM算法进行情感预测建模。针对实验中的四种目标情感,建立四种弱预测模型。每个弱预测模型由一种基本的预测模型和其它辅助预测模型组成。实验对比了基于GMM和基于Boosting-GMM的特征预测模型的效果。由于Boosting-GMM实现了重新采样的过程,在训练集中增大了包含大预测误差的样本比例,所以基于Boosting-GMM算法对于GMM算法的预测模型有更高的预测准确率。最后通过预测模型得到的参数和STRAIGHT算法合成出目标情感语音。实验表明,通过该方法合成的情感语音具有较好的音质和自然度。
【图文】:

情感,情感状态,维度


Fig邋3.1邋Emotion邋6NB口化55{011邋based邋011邋emotion邋wheel逡逑在连续空间中描述惰感的维度论中,还有一个重要的模型是由Cowie等研究逡逑者提出的激励-评价(Activation—Evaluation邋)模型,如图3.2所示,该模型认为不同逡逑情感是不断变化的,根据其在维度空间中的距离来体现不同的情感状态。逡逑激励-评价模型中包含两个二维空间:激活度(Activation)和评价度逡逑(Evaluation邋)。激活度表示与情感状态相关联的机能激活程度,评价度表示其理论逡逑基础来自于正负情感的分离程度。横轴表示评价度,指引起情感的客观事物评价逡逑23逡逑

分布情况,情感,均值,分布情况


图3.邋4不同情感下F0范围的分布逡逑Kg邋3.4邋Distribution邋for邋F0邋i*ange邋of邋diffei*ent邋emotions逡逑从w上图表中分析得出,不同情感状态下的基频相关特性参数分布有很大的逡逑差异,离兴情感下的F0的均值,F0最大值和最小值W及F0范围明显较大。惊奇逡逑的基频均值较大,但基频变化范围不大。悲伤的基频相关的特征参数都比中性语逡逑调的要小,基频均值最低。对于生气的情感语句,它的基频均值和基频变化范围逡逑较大。男性的基频相关特征参数在这几种情感下均低于女性基频相关参数。逡逑同时,,由图表可知,不同情感状态下F0均值和F0最大值整体变化相对F0最逡逑小值较小,这意味F0均值和F0最大值比F0最小值更适合来描述情感语音的基频逡逑特征。逡逑3.3.3情感语音的时长分析逡逑对情感语音的时长分析是通过语句的长短来判断相应的情感类型。计算的情逡逑感语句从语音数据开始到结束的持续时间,也包括停顿的部分。实验中,我们直逡逑
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TN912.3

【相似文献】

相关期刊论文 前10条

1 周海涛;;语音合成中多音字识别的实现[J];科技资讯;2008年11期

2 彭腾;孙萍;;基于C#语音合成的实现[J];电脑编程技巧与维护;2010年12期

3 张世平;;会说四种话的语音合成卡——声威一号[J];今日电子;1993年01期

4 赵建洋;;一种高效语音合成方法[J];电子技术;1993年08期

5 马义德,张新国,罗长印;语音合成电路在我国的应用前景[J];电子技术;1994年12期

6 郝杰;语音合成:引领“耳朵经济”[J];中国电子商务;2001年Z2期

7 罗三定,贾建华,沙莎;基于波形音频段处理的中文语音合成研究[J];电脑与信息技术;2002年01期

8 ;国内语音合成领域专利技术发展趋势[J];电子知识产权;2003年10期

9 周洁,赵力,邹采荣;情感语音合成的研究[J];电声技术;2005年10期

10 王永生;柴佩琪;曾令平;;英语语音合成中基于约束树的音节切分算法[J];微型电脑应用;2005年11期

相关会议论文 前10条

1 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

2 徐俊;蔡莲红;吴志勇;;多语种语音合成平台的设计与实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

3 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年

4 陶建华;董宏辉;许晓颖;;情感语音合成的关键技术分析[A];第六届全国现代语音学学术会议论文集(下)[C];2003年

5 刘东华;冯静;力梅;;深圳市新一代“12121”语音合成业务系统[A];中国气象学会2007年年会气象软科学论坛分会场论文集[C];2007年

6 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

7 邹煜;何伟;侯敏;滕永林;朱维彬;;面向语音合成的新闻播报语音库构建及其特殊韵律结构[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

8 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

9 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

10 吴志勇;蔡莲红;蒙美玲;;可视语音合成中基于音视频关联模型的视位参数优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年

相关重要报纸文章 前10条

1 记者 桂运安;中科大11项语音合成指标世界第一[N];安徽日报;2014年

2 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年

3 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年

4 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年

5 ;嵌入式语音合成平台[N];计算机世界;2002年

6 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年

7 ;新型语音合成软件面世[N];人民邮电;2008年

8 炎黄新星公司供稿;炎黄之声SinoSonic[N];计算机世界;2002年

9 刘权;语音合成融入证券客服[N];中国计算机报;2003年

10 ;语音产品走向开放式架构[N];中国计算机报;2004年

相关博士学位论文 前9条

1 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年

2 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年

3 苏庄銮;情感语音合成[D];中国科学技术大学;2006年

4 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年

5 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年

6 蔡明琦;融合发音机理的统计参数语音合成方法研究[D];中国科学技术大学;2015年

7 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年

8 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年

9 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年

相关硕士学位论文 前10条

1 王泽勋;多层次韵律和短时谱同步变换的情感语音合成[D];苏州大学;2015年

2 熊林云;基于ARM Cortex-M3的语音合成软件系统设计与实现[D];电子科技大学;2014年

3 章琴;基于HMM的中文情感语音合成的研究[D];合肥工业大学;2014年

4 聂军;基于HMM可训练的汉语语音合成系统[D];吉林大学;2010年

5 曾一鸣;情感语音合成的研究和系统实现[D];上海交通大学;2010年

6 刘航;基于隐马尔可夫模型的跨语种语音合成方法研究[D];中国科学技术大学;2011年

7 张桂香;个性化语音合成的研究与实现[D];哈尔滨工程大学;2007年

8 胡琼;基于隐马尔科夫模型的天津方言语音合成[D];上海交通大学;2011年

9 刘博;藏语拉萨方言的统计参数语音合成的研究[D];西北师范大学;2012年

10 吕斌;嵌入式语音合成及其关键算法的研究与实现[D];西安电子科技大学;2009年



本文编号:2548093

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2548093.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户47ca4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com