面向大语料库的语音合成方法研究
本文关键词:面向大语料库的语音合成方法研究 出处:《北京大学学报(自然科学版)》2014年05期 论文类型:期刊论文
更多相关文章: 语音数据筛选 声学模型训练 基于HMM的单元挑选与波形拼接
【摘要】:针对几百小时粗标注大语料库,提出一种新颖的语音合成系统构建方法。首先,借助于语音识别、文本对齐和句法分析等技术实现大语料库的自动筛选与标注。然后,为了有效解决大语料库声学模型训练中存在的内存空间以及计算时间开销过大等问题,优化了传统的训练流程,在不损失声学模型准确性的前提下,显著提高了模型的训练速度。主观实验表明,与具有精标注的小语料库相比,引入粗标注的大语料库可以带来0.5分左右的MOS提升。
[Abstract]:A novel method of constructing speech synthesis system is proposed for hundreds of hours rough tagging large corpus. Firstly, speech recognition is used. Text alignment and syntactic analysis techniques can automatically screen and annotate large corpora. Then, in order to effectively solve the problems of memory space and excessive computational time in large corpus acoustic model training. The traditional training process is optimized and the training speed of the model is significantly improved without losing the accuracy of the acoustic model. The subjective experiment shows that compared with the small corpus with fine tagging. The introduction of a large corpus of coarse tagging can lead to a MOS upgrade of about 0. 5 minutes.
【作者单位】: 北京大学言语听觉研究中心 机器感知与智能教育部重点实验室;
【基金】:国家自然科学基金(91120001,61121002) 国家社会科学基金重大项目(12&ZD119) 国家重点基础研究发展计划(2013CB329304)资助
【分类号】:TN912.3
【正文快照】: 语音合成是智能人机交互中必不可少的关键技术,它让计算机可以像人一样具备说话能力。目前最流行的两种方法是基于大语料库的单元挑选与波形拼接方法[1]和基于隐马尔科夫模型(HMM)的语音合成方法[2]。前者直接利用挑选出波形拼接得到合成语音,优点是保持了原始发音人的音质,缺
【参考文献】
相关期刊论文 前2条
1 曹剑芬;基于语法信息的汉语韵律结构预测[J];中文信息学报;2003年03期
2 蔡莲红;崔丹丹;蔡锐;;汉语普通话语音合成语料库TH-CoSS的建设和分析[J];中文信息学报;2007年02期
相关博士学位论文 前1条
1 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
【共引文献】
相关期刊论文 前10条
1 郭淑妮;图雅;斯琴高娃;;蒙古语语音合成语料库的设计及韵律标注规范的建立[J];电脑与电信;2012年03期
2 甘星超;陈毅东;;引入韵律结构信息的层次短语模型改进研究[J];电脑知识与技术;2013年12期
3 钱揖丽;荀恩东;;基于分类回归树CART的汉语韵律短语边界识别[J];计算机工程与应用;2008年06期
4 姑丽加玛丽·麦麦提艾力;艾斯卡尔·肉孜;艾斯卡尔·艾木都拉;;三音素模型的维吾尔语最佳文本选取算法[J];计算机工程与应用;2009年18期
5 郭威彤;杨鸿武;梁青青;裴东;;普通话到西安话的韵律转换[J];计算机工程与应用;2011年16期
6 钱揖丽;荀恩东;宋柔;;基于SLM的二叉树在语音停顿预测中的应用[J];计算机工程;2006年19期
7 严志宇;赵欣如;王璐;谢簪;李峤;谭军华;;普通话测试语音信息库的设计与实现[J];计算机时代;2010年03期
8 章森;刘磊;刁麓弘;;大规模语音语料库及其在TTS中应用的几个问题[J];计算机学报;2010年04期
9 赵永贞 ,刘挺 ,王志伟 ,陈惠鹏 ,邵艳秋;汉语文语转换系统中停顿指数的自动标注[J];中文信息学报;2004年05期
10 刘浩杰;杜利民;;汉语韵律词F0曲线的优化[J];中文信息学报;2006年01期
相关博士学位论文 前10条
1 柳春;甘肃临夏方言回腔语音格局研究[D];西北民族大学;2010年
2 李凤杰;汉英对比韵律系学中的若干问题[D];南开大学;2010年
3 单振宇;情感说话人识别及其解决方法的研究[D];浙江大学;2010年
4 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
5 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年
6 孙爱珍;计算文体学工作模式探究[D];河南大学;2008年
7 黄平牧;中文TTS系统中若干关键技术研究[D];北京邮电大学;2008年
8 敖敏;基于韵律的蒙古语语音合成研究[D];内蒙古大学;2012年
9 宋时黄;韩国学生汉语简单介绍句韵律研究[D];北京大学;2013年
10 陈钒;语言节奏提取及其在文本分析中的应用[D];天津大学;2011年
相关硕士学位论文 前10条
1 左石凯;语音合成算法研究与FPGA实现[D];哈尔滨理工大学;2010年
2 景娟;中文话费文语转换系统的研究与实现[D];中南大学;2011年
3 梁青青;兰州方言的声学特征分析和语音合成的研究[D];西北师范大学;2010年
4 索南扎西;藏语语音合成关键技术研究[D];西藏大学;2011年
5 贾莹;韵律句法理论观照下的现代汉语副词研究[D];西北师范大学;2011年
6 洪沣;基于嵌入式Linux语音合成关键技术的研究与实现[D];哈尔滨工程大学;2011年
7 陈琪;藏语拉萨话新闻体韵律模型研究[D];西北民族大学;2011年
8 贾志浩;汉语语音合成系统的改进与实现[D];南京理工大学;2012年
9 姚益龙;“VP+NP_1+的+NP_2”结构歧义的研究[D];首都师范大学;2007年
10 李芳兰;留学生朗读说话中停延能力研究[D];暨南大学;2007年
【二级参考文献】
相关期刊论文 前4条
1 崔丹丹;蔡莲红;;基于决策树的语料库分析[J];计算机工程;2006年21期
2 应宏,蔡莲红;基于结构助词驱动的韵律短语界定的研究[J];中文信息学报;1999年06期
3 王洪君;;汉语的韵律词与韵律短语[J];中国语文;2000年06期
4 蔡莲红,赵世霞;汉语语音合成语料库的研究与建立[J];语言文字应用;1999年03期
相关博士学位论文 前1条
1 吴义坚;基于隐马尔科夫模型的语音合成技术研究[D];中国科学技术大学;2006年
【相似文献】
相关期刊论文 前10条
1 杨庆江,谢子殿,于海英,郭明良;智能语音人体秤的设计[J];黑龙江矿业学院学报;1997年02期
2 韩丽萍,张丽红;语音应答系统的设计[J];锦州师范学院学报(自然科学版);2001年01期
3 何去非;方恒;;机器人语音接口的开发[J];芜湖职业技术学院学报;2007年04期
4 陈丽娟,刘淑英,刘书琴;MCS-51单片机用于语音合成系统[J];信息技术;1994年04期
5 唐明道;大容量可编程语音合成电路[J];电子技术;1996年07期
6 梁志强,李海洲;线性预测编码在变音长语音合成中的应用[J];华南理工大学学报(自然科学版);1998年03期
7 杜凯;计算机语音技术及其展望(上)[J];黑龙江水利科技;1998年01期
8 左岐;新型智能变送器的研制[J];仪表技术与传感器;1999年08期
9 赵晓虹,叶建明;小型电话语音查询系统的设计与实现[J];四川通信技术;2001年05期
10 赵欢,谭华;Apriori算法在语音合成应用中的一种改进[J];湖南大学学报(自然科学版);2004年05期
相关会议论文 前10条
1 祝韶晖;刘文举;吴玺宏;;一种新的基于匹配的语音合成基元选取算法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
2 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
3 江源;朱双华;凌震华;戴礼荣;;基于HMM的单元挑选语音合成中的改进方法研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
4 易立夫;苏鹤玲;孙金城;;基于HNM算法的汉语语音合成系统[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
5 易立夫;苏鹤玲;孙金城;;基于HNM算法的汉语语音合成系统[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
6 高璐;陈琪;李永宏;于洪志;;藏语语音合成中本文分析的若干问题研究[A];第九届中国语音学学术会议论文集[C];2010年
7 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
8 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 那兴宇;谢湘;匡镜明;何娅玲;;用于统计语音合成的大尺度压缩HMM的方法[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
10 那兴宇;谢湘;匡镜明;何娅玲;;一种用于统计语音合成的大尺度压缩HMM的方法[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
相关重要报纸文章 前10条
1 ;嵌入式语音合成平台[N];计算机世界;2002年
2 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年
3 记者 汪永安;科大讯飞获国际英文合成大赛“六连冠”[N];安徽日报;2011年
4 刘权;语音合成融入证券客服[N];中国计算机报;2003年
5 刘羚;语音合成发挥作用[N];中国计算机报;2003年
6 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年
7 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年
8 李壮;陶建华 行胜于言的语音合成专家[N];中国高新技术产业导报;2007年
9 记者 吴长锋;科大讯飞英文语音合成系统获奖[N];科技日报;2006年
10 ;开放架构支持更多应用[N];中国计算机报;2004年
相关博士学位论文 前10条
1 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
2 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年
3 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
4 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年
5 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
6 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
7 周群群;多带激励声码器关键算法的研究[D];华中科技大学;2013年
8 双志伟;个性化语音生成研究[D];中国科学技术大学;2011年
9 孙俊;基于激励源及其韵律特征的源—目标说话人声音转换研究[D];中国科学技术大学;2006年
10 孙颖;情感语音识别与合成的研究[D];太原理工大学;2011年
相关硕士学位论文 前10条
1 史水平;汉语语音合成技术的研究[D];广西大学;2004年
2 孟利青;基于DSP的中文电子阅读系统的研究[D];辽宁工程技术大学;2005年
3 贾建华;语音合成及语音处理[D];中南大学;2002年
4 党培霞;基于情感基音模板的情感语音合成[D];中南大学;2010年
5 史学晶;基于原型波形内插算法的语音问题的研究[D];北京化工大学;2004年
6 陈翔;基于板卡“教师家长一线通系统”研究和实现[D];西南交通大学;2005年
7 杜朝阳;语音合成技术及手机语音词典的研究[D];山东大学;2005年
8 赵博;中文语音合成系统的评测方法研究[D];清华大学;2005年
9 乔英霞;语音合成算法研究及嵌入式语音合成系统的实现[D];山东大学;2005年
10 努尔比娅·塔依尔;面向语音合成的维吾尔语韵律层级自动标注算法研究[D];新疆大学;2010年
,本文编号:1407458
本文链接:https://www.wllwen.com/kejilunwen/wltx/1407458.html