当前位置:主页 > 科技论文 > 信息工程论文 >

马来语语音合成系统的实现与改进

发布时间:2021-11-19 20:15
  随着语音合成、语音识别等技术的快速发展,人机语音交互应用越来越普及。如何使机器发出与真人一致的声音,一直是语音技术研究者追求的目标,基于DNN(深度神经网络)的深度学习已成为提升语音合成系统性能的有效途径。迄今为止,已取得的语音合成研究成果主要集中在英语、汉语等语言,其他语言的相关研究成果还需进一步丰富。马来西亚语(简称马来语)属于属南岛语系马来-波利尼西亚语族,广泛使用于马来西亚、新加坡、文莱等地。本文以开发马来语语音合成应用系统为目的,采用HMM以及DNN,探索提高语音合成系统性能的途径。论文的主要工作有:(1)根据马来语的书写与发音特点,分别以声韵母结构和音素结构实现马来语的音子自动切分,并根据自动切分结果选择了音素结构作为马来语语音合成的建模基元。(2)根据马来语的语言特征设计了五音子上下文属性与问题集,并实现上下文属性集的自动生成。在此基础上,设计并调试了基于HMM与五音子上下文属性的马来语语音合成系统,实现了模型的训练以及语音的合成。(3)针对基于HMM语音合成系统中决策树声学模型的问题,采用全连接的深度神经网络代替决策树作为声学模型,重新进行系统训练与语音合成,相对于HM... 

【文章来源】:云南大学云南省 211工程院校

【文章页数】:67 页

【学位级别】:硕士

【部分图文】:

马来语语音合成系统的实现与改进


图2-1从训练音频中提取的Mel域倒谱特征??

建模方式,马来语,音子


升合成语音的质量。??八八八??图2-3?sp音子三状态空跳结构??2.2马来语语音合成基元的选取??选择合适的合成单元是语音合成的关键步骤。将选择的建模单元组成所需的??音子列表,作为维特比算法在对HMM模型进行解码的过程中的词典。??从语言学角度看,马来语是一种黏着性语言【2G],所以马来语有明显的音节结??构,虽然马来语书写方式与英语类似,但是其发音方式并不相同,通过查阅相关??资料以及咨询马来语专家,得到马来语的发音与汉语有一定的相似。从音节结构??分析,马来语一般以辅音一元音(CV)、辅音一元音一辅音(CVC)、元音(V)??和元音一辅音(VC)结构为主。因此,本文请教了相关的马来语专家,参照汉语??的声韵母划分方法,根据音节的结构,在己经确定的马来语合成基元中,又分别??得到鼻音音子、爆破音音子和V-C结构构成的韵母音子

流程图,马来语,音子,自动切分


I?(i|j—1Hwe?—t?单音??图2-4马来语音子自动切分的流程??由图2-4可知,完成马来语的音子自动切分,总共分为三个阶段。以下本文将??对三个阶段分别进行具体的介绍和分析。??首先在第一阶段要准备好训练的数据。本文共选取了?2000句马来语语料和对??应的录音,将2000句语料进行非法字符的筛选并按照音子、音节、单词等边界生??成对应的韵律文本,其中以‘[]’代表词边界,‘/’代表音节边界,空格代表音??子边界,如下表所示(以下示例均为以音素结构进行切分的样例):??表2-3边界信息韵律文本??文本内容??马来语罗马化文本?anda*harus*sentiasa*menjangkakan??边界信息韵律文本?[a?n/d?a][h?a/r?u?s][s?e?n/t?i?a/s?a]?[m?e?n/j?a?ng/k?a/k?a?n]??-?■?■■■-■■???,一?■?■?■?■??再核对韵律文本和语料录音,排除错误发音以及边界划分错误。然后从韵律??文本中生成对应的均匀划分的单音子标注,如下表所示(只选取了一句中的部分,??时间单位为100ns)。??11??


本文编号:3505783

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3505783.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户efde3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com