普通话与邢台方言的跨语言语音合成的研究
本文关键词:普通话与邢台方言的跨语言语音合成的研究
更多相关文章: 多语种语音合成 方言语音合成 文本分析 隐马尔科夫模型 说话人自适应训练
【摘要】:中国是一个地域辽阔,方言语言丰富的国家。随着语音合成技术的发展,已有研究学者对方言语音的合成展开研究。中国方言与普通话之间除了发音及声调差异外,还存在特殊词汇的差异。针对此特点,本论文以邢台方言为研究对象,对比了普通话与邢台方言的发音差异,提出一种邢台方言和普通话混合语言的文本分析方法,将普通话的词汇转换为邢台方言的特殊词汇,获得语音合成所需的上下文相关的标注文本。在此基础上,利用基于隐Markov模型(Hidden Markov Model,HMM)的统计参数语音合成方法,采用说话人自适应训练(Speaker Adaptive Training,SAT)和说话人自适应变换技术,合成出邢台方言或普通话的语音。论文的主要工作和创新如下:1.设计了一套邢台方言和普通话通用的机读音标方案和特殊词汇替换词典。通过对比普通话与邢台方言在声韵母和声调上的差异,设计了一套用来标注普通话发音和邢台方言发音的标注方案SAMPA-XT(Speech Assessment Methods Phonetic Alphabet for Xing Tai),能够将输入的文本转换为相应的读音。同时,根据文白异读词汇上的发音差异,设计了一个普通话词汇到邢台方言词汇转换的方言词汇词典,用于将输入本文中的普通话词汇替换为邢台方言词汇。2.建立了一个面向语音合成的邢台方言/普通话的双语语料库。根据邢台方言的发音特点,设计了300句邢台方言的文本语料,覆盖邢台方言声韵母、声调以及常用文白异读词汇的发音特点。根据文本语料,分别录制了普通话方言的语音语料。3.实现了邢台方言的文本分析,能够将输入的文本转换为语音合成所需的上下文相关的标注文本。首先将输入文本转换成普通话拼音,再利用方言的变音规则和特殊词汇词典获得文本的方言声韵母读音,并用SMPA-XT表示。同时利用文本分析获得的声韵母信息、词信息、韵律结构信息和语句信息,产生用于语音合成的上下文相关的标注。4.实现了普通话与邢台方言的跨语言语音合成。利用多个说话人的普通话语音和少量的邢台方言训练语音,在基于HMM的统计参数语音合成的训练中引入说话人自适应训练和说话人自适应变换,获得邢台方言或普通话的声学模型,从而合成出普通话语音或邢台方言语音。主观评测结果表明,在方言语料训练集较少的情况下,本文提出的方法合成的邢台方言语音的音质优于传统方法。
【学位授予单位】:西北师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:H172.1
【相似文献】
中国期刊全文数据库 前10条
1 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成[J];清华大学学报(自然科学版);2013年06期
2 杨顺安;语音合成与语音学研究[J];语文建设;1992年08期
3 冯志伟;;语音合成中的文本归一化问题[J];北华大学学报(社会科学版);2010年02期
4 俞振利,程伯中;基于语音生成和发音模型的语音合成新方法的探讨[J];声学学报;2000年05期
5 许宁;;线性预测语音合成(LPC)的优化方法[J];成才;1999年03期
6 李永宏;于洪志;;安多藏语语音合成语料库的设计[J];西北民族大学学报(自然科学版);2006年01期
7 漆福刚;;谐体民歌节奏特征的时长表现[J];襄樊职业技术学院学报;2010年05期
8 陈小莹;;藏语拉萨话语音合成语料库的研究与建立[J];科技信息;2013年09期
9 吴岩,刘挺,,李秀坤,王开铸;语句级音调规律的研究与实现[J];中文信息学报;1997年01期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 杨静;孙金城;;关于录制语音合成数据库的几个问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 徐俊;蔡莲红;吴志勇;;多语种语音合成平台的设计与实现[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
3 陈益强;高文;王兆其;杨长水;姜大龙;;多模式语音合成[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 陶建华;董宏辉;许晓颖;;情感语音合成的关键技术分析[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
5 刘东华;冯静;力梅;;深圳市新一代“12121”语音合成业务系统[A];中国气象学会2007年年会气象软科学论坛分会场论文集[C];2007年
6 黄小明;熊子瑜;;基于古音系统的汉语方言语音合成研究[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
7 邹煜;何伟;侯敏;滕永林;朱维彬;;面向语音合成的新闻播报语音库构建及其特殊韵律结构[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 陶建华;康永国;;基于多元激励的高质量语音合成声学模型[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
10 吴志勇;蔡莲红;蒙美玲;;可视语音合成中基于音视频关联模型的视位参数优化[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 桂运安;中科大11项语音合成指标世界第一[N];安徽日报;2014年
2 本报记者 何进伟;语音合成露峥嵘[N];网络世界;2001年
3 李羚;多语种语音合成助力数字奥运[N];中国计算机报;2003年
4 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年
5 ;嵌入式语音合成平台[N];计算机世界;2002年
6 孙晓闻;语音合成 让机器“像人一样说话”[N];中国劳动保障报;2005年
7 ;新型语音合成软件面世[N];人民邮电;2008年
8 炎黄新星公司供稿;炎黄之声SinoSonic[N];计算机世界;2002年
9 刘权;语音合成融入证券客服[N];中国计算机报;2003年
10 ;语音产品走向开放式架构[N];中国计算机报;2004年
中国博士学位论文全文数据库 前10条
1 高莹莹;面向情感语音合成的言语情感建模研究[D];北京交通大学;2016年
2 高裴裴;人眼驱动语音合成的若干关键技术研究[D];南开大学;2012年
3 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年
4 苏庄銮;情感语音合成[D];中国科学技术大学;2006年
5 卢恒;基于统计模型与发音错误检测的语音合成方法研究[D];中国科学技术大学;2011年
6 雷鸣;统计参数语音合成中的声学模型建模方法研究[D];中国科学技术大学;2012年
7 蔡明琦;融合发音机理的统计参数语音合成方法研究[D];中国科学技术大学;2015年
8 凌震华;基于统计声学建模的语音合成技术研究[D];中国科学技术大学;2008年
9 杨辰雨;语音合成音库自动标注方法研究[D];中国科学技术大学;2014年
10 尉洪;汉语基元音素独立分量谱分析对比及语音合成研究[D];云南大学;2011年
中国硕士学位论文全文数据库 前10条
1 李冰洁;基于声韵母的嵌入式语音合成[D];北京交通大学;2016年
2 李焕君;个性化语音合成在船舶导航系统中应用研究[D];大连海事大学;2016年
3 冯欢;基于HMM的歌词到歌声转换的研究[D];西北师范大学;2015年
4 王海燕;汉藏双语跨语言统计参数语音合成的研究[D];西北师范大学;2015年
5 孙晓辉;结合听感度量的语音合成方法研究[D];中国科学技术大学;2016年
6 李翔凰;基于HMM-RBM的蒙古语语音合成研究[D];内蒙古大学;2016年
7 王雨蒙;英语文语转换系统中的ToBl韵律自动标注方法与实现[D];云南大学;2016年
8 戈永侃;改进语音合成自然度的研究[D];江南大学;2016年
9 韩云飞;汉、维语音合成在新疆农村信息推送系统中的应用研究[D];新疆农业大学;2016年
10 郝东亮;统计参数情感语音合成的研究[D];西北师范大学;2016年
本文编号:1225704
本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/1225704.html