基于深度学习的安多方言到卫藏方言语音转换的研究
发布时间:2021-01-19 22:29
藏族的不同方言在发音上的巨大差异,造成了不同方言区的人们在面对面交流时存在着巨大的困难。近年来,汉语和英语的语音转换技术取得了很大进步,但是目前只有使用五度字调模型实现的藏语语音转换。该方法只修改基频曲线,且转换后的音质较差。为此,我们提出利用深度学习方法,使用深度神经网络(Deep Neural Network,DNN)分别在平行语料和非平行语料情况下实现藏语的安多方言到卫藏方言语音转换的实验。主要的研究工作与创新如下:1、分析了两种方言的差异性,分别建立了平行语料库和非平行语料库。2、利用平行语料方法实现安多方言到卫藏方言的语音转换。在训练阶段,提取了两种方言语音语料的声学特征参数,利用DNN训练了转换模型。在转换阶段,输入安多方言语音的声学特征参数,经过转换模型可得到转换后的卫藏方言语音的声学特征参数,最后经过声码器合成卫藏方言语音。3、利用非平行语料方法实现安多方言到卫藏方言的语音转换。首先,根据两种方言的发音差异,设计了两种方言的发音映射表。根据发音映射表,设计了识别阶段的发音字典和合成阶段的上下文相关标注。然后利用DNN作为安多方言语音识别和卫藏方言语音合成的网络模型。4、...
【文章来源】:西北师范大学甘肃省
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
藏文合并后的部分文本在对所有文本语料进行合并后,为了得到覆盖所有藏文字发音的字典,本文
第4章基于非平行语料的语音转换-29-SAMPA-TW用来标注卫藏方言的声韵母,用来作为合成基元合成卫藏方言。根据标注格式,设计的卫藏方言的上下文相关标注的部分示例如下。图4.3设计的卫藏方言的上下文相关标注4.3.2问题集的设计问题集的设计依赖于卫藏方言的语言学知识,而且与上文设计的上下文相关标注文件相匹配。在设计的问题集中,每一行都是在描述一个真假问题,涉及音段信息和位置时长信息。声韵母的分类问题是问题集的音段信息主要解决的问题,Initial和Final分别用来表示卫藏方言的声母和韵母的问题集。QS“is_Initial”{p,t,c,k,……}QS“is_Final”{a,i,e,o,……}根据发音位置的不同,卫藏方言中声母可分为双唇音、舌前音等,它们相应的问题集设计如下:QS“is_bilabial”{p,ph,m,……}QS“is_dental”{ts,tsh,dz,……}根据发音方法的不同,卫藏方言中声母可分为鼻音和边音等,它们相应的问题集设计如下:QS"is_nasal"{m,n,ny,……}QS"is_lateral"{l}
【参考文献】:
期刊论文
[1]藏文情感语料库的构建与分析[J]. 杨欣,群诺,郭龙银,孟姚媛. 计算机时代. 2019(09)
[2]面向藏语声纹识别的语料库建设[J]. 周雁,西绕多吉. 计算机工程与科学. 2018(11)
[3]面向哈萨克语LVCSR的语言模型构建方法研究[J]. 达吾勒·阿布都哈依尔,努尔买买提·尤鲁瓦斯,刘艳. 计算机工程与应用. 2016(24)
[4]面向汉语统计参数语音合成的标注生成方法[J]. 郝东亮,杨鸿武,张策,张帅,郭立钊,杨静波. 计算机工程与应用. 2016(19)
[5]安多方言—夏河话SAMPAAT设计[J]. 陈小莹,艾金勇. 智能计算机与应用. 2016(01)
[6]“大型藏文基础语料库”数据分析[J]. 高定国,扎西加,赵栋材. 西北民族大学学报(自然科学版). 2013(04)
[7]藏语拉萨话语音合成语料库的研究与建立[J]. 陈小莹. 科技信息. 2013(09)
[8]卫藏方言与安多方言语音分析[J]. 更登磋. 西藏研究. 2012(05)
[9]藏语拉萨话大词表连续语音识别声学模型研究[J]. 李冠宇,孟猛. 计算机工程. 2012(05)
[10]利用SAMPA实现藏语的字音转换[J]. 刘博,杨鸿武,甘振业,郭威彤. 计算机工程与应用. 2011(35)
硕士论文
[1]安多方言到卫藏方言语音转换的研究[D]. 郭颖.西北师范大学 2018
[2]基于DNN的汉语到藏语跨语言语音转换的研究[D]. 阮文彬.西北师范大学 2018
[3]汉藏双语跨语言语音转换中韵律控制方法的研究[D]. 贾浩洁.西北师范大学 2016
[4]汉藏双语跨语言语音转换方法的研究[D]. 王振文.西北师范大学 2015
[5]藏语安多话音色转换技术研究及其实现[D]. 张高杰.西北民族大学 2010
本文编号:2987828
【文章来源】:西北师范大学甘肃省
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
藏文合并后的部分文本在对所有文本语料进行合并后,为了得到覆盖所有藏文字发音的字典,本文
第4章基于非平行语料的语音转换-29-SAMPA-TW用来标注卫藏方言的声韵母,用来作为合成基元合成卫藏方言。根据标注格式,设计的卫藏方言的上下文相关标注的部分示例如下。图4.3设计的卫藏方言的上下文相关标注4.3.2问题集的设计问题集的设计依赖于卫藏方言的语言学知识,而且与上文设计的上下文相关标注文件相匹配。在设计的问题集中,每一行都是在描述一个真假问题,涉及音段信息和位置时长信息。声韵母的分类问题是问题集的音段信息主要解决的问题,Initial和Final分别用来表示卫藏方言的声母和韵母的问题集。QS“is_Initial”{p,t,c,k,……}QS“is_Final”{a,i,e,o,……}根据发音位置的不同,卫藏方言中声母可分为双唇音、舌前音等,它们相应的问题集设计如下:QS“is_bilabial”{p,ph,m,……}QS“is_dental”{ts,tsh,dz,……}根据发音方法的不同,卫藏方言中声母可分为鼻音和边音等,它们相应的问题集设计如下:QS"is_nasal"{m,n,ny,……}QS"is_lateral"{l}
【参考文献】:
期刊论文
[1]藏文情感语料库的构建与分析[J]. 杨欣,群诺,郭龙银,孟姚媛. 计算机时代. 2019(09)
[2]面向藏语声纹识别的语料库建设[J]. 周雁,西绕多吉. 计算机工程与科学. 2018(11)
[3]面向哈萨克语LVCSR的语言模型构建方法研究[J]. 达吾勒·阿布都哈依尔,努尔买买提·尤鲁瓦斯,刘艳. 计算机工程与应用. 2016(24)
[4]面向汉语统计参数语音合成的标注生成方法[J]. 郝东亮,杨鸿武,张策,张帅,郭立钊,杨静波. 计算机工程与应用. 2016(19)
[5]安多方言—夏河话SAMPAAT设计[J]. 陈小莹,艾金勇. 智能计算机与应用. 2016(01)
[6]“大型藏文基础语料库”数据分析[J]. 高定国,扎西加,赵栋材. 西北民族大学学报(自然科学版). 2013(04)
[7]藏语拉萨话语音合成语料库的研究与建立[J]. 陈小莹. 科技信息. 2013(09)
[8]卫藏方言与安多方言语音分析[J]. 更登磋. 西藏研究. 2012(05)
[9]藏语拉萨话大词表连续语音识别声学模型研究[J]. 李冠宇,孟猛. 计算机工程. 2012(05)
[10]利用SAMPA实现藏语的字音转换[J]. 刘博,杨鸿武,甘振业,郭威彤. 计算机工程与应用. 2011(35)
硕士论文
[1]安多方言到卫藏方言语音转换的研究[D]. 郭颖.西北师范大学 2018
[2]基于DNN的汉语到藏语跨语言语音转换的研究[D]. 阮文彬.西北师范大学 2018
[3]汉藏双语跨语言语音转换中韵律控制方法的研究[D]. 贾浩洁.西北师范大学 2016
[4]汉藏双语跨语言语音转换方法的研究[D]. 王振文.西北师范大学 2015
[5]藏语安多话音色转换技术研究及其实现[D]. 张高杰.西北民族大学 2010
本文编号:2987828
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2987828.html