基于深度学习的彝语语音合成的研究
【文章页数】:47 页
【学位级别】:硕士
【部分图文】:
图4.2基线E2E模型在使用实验数据A时的损失收敛图
第4章彝语语音合成的实验23为0.5,在进行到40k步时进行衰减。训练均进行100k步,训练过程中进行观察,每5k步进行一次验证集的验证,保证训练的模型不会有太大偏差。没训练好的模型在预测时,G&L算法的能量参数设置为1.2,而其迭代上限为60次。4.2.3实验评测本文对基于E2....
图4.4带有文本分析的E2E模型在使用实验数据A时的损失收敛图
第4章彝语语音合成的实验24对于带有文本分析的E2E模型框架,由于加入了专家知识,网络结构多出一部分,参数训练相对变多。当实验数据仅为A时,在35k步左右才趋于平缓,也在70k步左右基本收敛,而使用全部数据时,收敛仍在35k不左右趋于平缓,而在70k步左右基本收敛。总得来说,当实....
图4.3基线E2E模型在使用实验数据A、B时的损失收敛图
第4章彝语语音合成的实验24对于带有文本分析的E2E模型框架,由于加入了专家知识,网络结构多出一部分,参数训练相对变多。当实验数据仅为A时,在35k步左右才趋于平缓,也在70k步左右基本收敛,而使用全部数据时,收敛仍在35k不左右趋于平缓,而在70k步左右基本收敛。总得来说,当实....
图4.5带有文本分析的E2E模型在使用实验数据A、B时的损失收敛图
第4章彝语语音合成的实验25表4.4为针对两个实验在不同实验数据下,产生不同结果后计算所得的MCD,表中结果分为在验证集上的结果和在测试集中的结果。由表4.4可以看出实验语料数量的增多可以有效地降低MCD,即有效地提高合成语音和原始语音的相似度,同时还可以观察出带有文本分析的E2....
本文编号:3978876
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3978876.html