当前位置:主页 > 科技论文 > 网络通信论文 >

语音合成音库自动标注方法研究

发布时间:2019-02-08 20:11
【摘要】:本文语音合成技术的发展现状为切入点,简要介绍了该技术的基本原理与实现方法,并明确指出语音合成技术的广阔发展前景要求其突破当下的诸多局限,将研究重点转向自动韵律标注方法。本文在简析了语音合成音库自动标注方法的研究意义之后,着重介绍了包括隐马尔科夫模型声学自动韵律标注方法、深度神经网络声学建模方法以及隐藏重音状态下的音标注方法在内的自动标注方法,我们阐述了以上方法的主要原理以及各自优缺,提倡相关领域在使用这几种方法时秉持互补的原则。
[Abstract]:In this paper, the present situation of the speech synthesis technology is the entry point, the basic principle and the implementation method of the technology are briefly introduced, and it is pointed out that the broad development prospect of the speech synthesis technology needs to break through many limitations of the present, and will focus on the automatic prosodic labeling method. After a brief analysis of the significance of the automatic marking method of the speech synthesis sound library, this paper emphatically introduces the method of automatic labeling including the acoustic automatic prosodic labeling method of the hidden Markov model, the acoustic modeling method of the depth neural network and the method of the automatic marking in the hidden stress state. We set forth the main principles of the above methods and their respective advantages, and promote the principle of complementarity when using these methods in the relevant fields.
【作者单位】: 珠海多玩信息技术有限公司;
【分类号】:TN912.33

【相似文献】

相关期刊论文 前10条

1 罗三定,贾建华,沙莎;基于波形音频段处理的中文语音合成研究[J];电脑与信息技术;2002年01期

2 ;国内语音合成领域专利技术发展趋势[J];电子知识产权;2003年10期

3 王永生;柴佩琪;曾令平;;英语语音合成中基于约束树的音节切分算法[J];微型电脑应用;2005年11期

4 王仁华;戴礼荣;凌震华;胡郁;;基于统计建模的可训练单元挑选语音合成方法[J];科学通报;2009年08期

5 杨志晓;隋菲;张德贤;;基于可视语音合成的3D通信技术研究[J];计算机应用研究;2009年11期

6 高璐;陈琪;李永宏;于洪志;;藏语语音合成中文本分析的若干问题研究[J];西北民族大学学报(自然科学版);2010年02期

7 孙永欣;苏瑞;;具有TTS功能的同步朗读系统[J];自动化技术与应用;2011年06期

8 杨风健;;轻松学会语音合成[J];电子制作;2011年08期

9 郭淑妮;图雅;斯琴高娃;;蒙古语语音合成语料库的设计及韵律标注规范的建立[J];电脑与电信;2012年03期

10 曲珍;春燕;;藏语语音合成中语料数据标注规则的设计[J];西藏大学学报(自然科学版);2012年01期

相关会议论文 前10条

1 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

2 徐俊;蔡莲红;吴志勇;;多语种语音合成平台的设计与实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年

3 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年

4 陶建华;董宏辉;许晓颖;;情感语音合成的关键技术分析[A];第六届全国现代语音学学术会议论文集(下)[C];2003年

5 刘东华;冯静;力梅;;深圳市新一代“12121”语音合成业务系统[A];中国气象学会2007年年会气象软科学论坛分会场论文集[C];2007年

6 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年

7 邹煜;何伟;侯敏;滕永林;朱维彬;;面向语音合成的新闻播报语音库构建及其特殊韵律结构[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

8 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年

9 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

10 吴志勇;蔡莲红;蒙美玲;;可视语音合成中基于音视频关联模型的视位参数优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年

相关重要报纸文章 前10条

1 记者 桂运安;中科大11项语音合成指标世界第一[N];安徽日报;2014年

2 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年

3 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年

4 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年

5 ;嵌入式语音合成平台[N];计算机世界;2002年

6 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年

7 ;新型语音合成软件面世[N];人民邮电;2008年

8 炎黄新星公司供稿;炎黄之声SinoSonic[N];计算机世界;2002年

9 刘权;语音合成融入证券客服[N];中国计算机报;2003年

10 ;语音产品走向开放式架构[N];中国计算机报;2004年

相关博士学位论文 前8条

1 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年

2 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年

3 苏庄銮;情感语音合成[D];中国科学技术大学;2006年

4 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年

5 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年

6 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年

7 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年

8 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年

相关硕士学位论文 前10条

1 聂军;基于HMM可训练的汉语语音合成系统[D];吉林大学;2010年

2 曾一鸣;情感语音合成的研究和系统实现[D];上海交通大学;2010年

3 刘航;基于隐马尔可夫模型的跨语种语音合成方法研究[D];中国科学技术大学;2011年

4 张桂香;个性化语音合成的研究与实现[D];哈尔滨工程大学;2007年

5 胡琼;基于隐马尔科夫模型的天津方言语音合成[D];上海交通大学;2011年

6 刘博;藏语拉萨方言的统计参数语音合成的研究[D];西北师范大学;2012年

7 吕斌;嵌入式语音合成及其关键算法的研究与实现[D];西安电子科技大学;2009年

8 吴振宇;个性特征的语音合成与模拟技术研究[D];华东师范大学;2011年

9 张鹏;汉语语音合成韵律控制方法与实现的研究[D];哈尔滨工程大学;2006年

10 鲁小勇;情感语音合成的研究[D];西北师范大学;2013年



本文编号:2418752

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/wltx/2418752.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e6900***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com