面向特定领域藏语统计参数语音合成的文本分析研究
发布时间:2021-11-12 23:32
中国是一个由56个少数民族组成的国家,藏语人口已达到38.58万人次,但是藏语研究相对较晚,尤其是统计参数藏语语音合成方面,缺乏相关文本分析,缺乏对于特定领域的藏语语音合成的文本分析。因此,本文针对已有的统计参数语音合成的文本分析中的词及词性层和语句层进行了改进,在语句层加入了文本的分类信息,然后利用此文本分析进行了藏语语音合成并获得了较好的合成效果。本论文的主要工作和创新如下:1.提出了3种藏语分词模型来获得词边界,分别为双向长短时记忆网络加条件随机场模型(Bi-directional long short-term memory with conditional random field model,BiLSTMCRF),卷积神经网络加双向长短时记忆网络加条件随机场模型(Convolutional neural network bi-directional long short-term memory with conditional random field model,CNNBiLSTMCRF)和序列到序列(Se...
【文章来源】:西北师范大学甘肃省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
藏字的组成结构
第2章基于深度学习的藏语文本分析相关问题6第2章基于深度学习的藏语文本分析本章主要是介绍了基于深度学习的藏语文本分析研究过程中需要用到的一些藏语理论和深度学习的相关模型及方法,如词向量,Dropout,相关神经网络等,通过这些已有的研究理论来进行后续研究。2.1藏语介绍藏语作为我国的一种民族语言,使用人口较多,分布域广阔,记录了多彩多样的藏族文化。藏语是一种拼写文字,同汉语拼音类似,是通过部首进行拼写,且书写必须从左到右从上到下。藏字部首在藏字中的位置有6种,如图2.1所示。藏文中每个藏字之间都由音节点进行分隔,但是藏词之间却不像英文单词一样有分隔标记,如图2.2所示为藏词示例。藏语总有15个元音,7个辅音韵尾,48个韵母,当代藏语拉萨音有四个声调,分别为高调、低调、降调和升调。图2.1藏字的组成结构图2.2藏词示例的组成结构2.2深度神经网络模型2.2.1卷积神经网络CNN模型结构图如图2.3所示,主要有三层构成[37]。
第2章基于深度学习的藏语文本分析相关问题7输入层:假如一个藏语句子有n个特征词且该词向量维度是k,那么输入的词向量矩阵为nk。卷积层:主要对藏文文本进行卷积运算,如式(2-1)所示。ii:11()iihCfWXb+=+(2-1)此中,结果用iC表示,h为窗口大小,词向量矩阵是i:i+h-1X,卷积核是1W,1b为偏置量,f为relu激活函数。池化层:上一层运算后的结果iC输入到池化层,对特征iC进行压缩。输出层:输入池化层的输出特征向量,通过类别概率计算,得到最终的预测类别yi定义如(2-2)所示:33ymax()iii=softWh+b(2-2)其中,3W为类别权值矩阵,3b为偏置量。图2.3CNN模型结构图2.2.2递归神经网络语言之间存在着相关性,尤其是上一个词和下一个词之间联系性更强。研究者为了能更好地解决文本语义之间的关系,提出了递归神经网络(Recurrentneuralnet,RNN),结构展开图如图2.4所示,因为RNN模型中增加了可以识别自然语言依赖关系循环结构。由于该特殊循环结构的存在保证了隐藏层中节点能够相互连接,也保证了上文中分析出来的信息能够传递到下文中,保留全文信息展开总体性的分析[38]。图2.4RNN模型展开图
【参考文献】:
期刊论文
[1]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[2]基于SVM藏文文本分类的研究与实现[J]. 贾宏云,群诺,苏慧婧,次仁罗增,巴桑卓玛. 电子技术与软件工程. 2018(09)
[3]基于深度学习的藏文分词方法[J]. 李博涵,刘汇丹,龙从军,吴健. 计算机工程与设计. 2018(01)
[4]藏语口语语音语料库的设计与研究[J]. 黄晓辉,李京,马睿. 计算机工程与应用. 2018(13)
[5]面向汉语统计参数语音合成的标注生成方法[J]. 郝东亮,杨鸿武,张策,张帅,郭立钊,杨静波. 计算机工程与应用. 2016(19)
[6]TIP-LAS:一个开源的藏文分词词性标注系统[J]. 李亚超,江静,加羊吉,于洪志. 中文信息学报. 2015(06)
[7]基于知识融合的CRFs藏文分词系统[J]. 洛桑嘎登,杨媛媛,赵小兵. 中文信息学报. 2015(06)
[8]基于深度神经网络的汉语语音合成的研究[J]. 王坚,张媛媛. 计算机科学. 2015(S1)
[9]判别式藏语文本词性标注研究[J]. 华却才让,刘群,赵海兴. 中文信息学报. 2014(02)
[10]融合音节特征的最大熵藏文词性标注研究[J]. 于洪志,李亚超,汪昆,冷本扎西. 中文信息学报. 2013(05)
博士论文
[1]藏语分词与词性标注研究[D]. 康才畯.上海师范大学 2014
本文编号:3491856
【文章来源】:西北师范大学甘肃省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
藏字的组成结构
第2章基于深度学习的藏语文本分析相关问题6第2章基于深度学习的藏语文本分析本章主要是介绍了基于深度学习的藏语文本分析研究过程中需要用到的一些藏语理论和深度学习的相关模型及方法,如词向量,Dropout,相关神经网络等,通过这些已有的研究理论来进行后续研究。2.1藏语介绍藏语作为我国的一种民族语言,使用人口较多,分布域广阔,记录了多彩多样的藏族文化。藏语是一种拼写文字,同汉语拼音类似,是通过部首进行拼写,且书写必须从左到右从上到下。藏字部首在藏字中的位置有6种,如图2.1所示。藏文中每个藏字之间都由音节点进行分隔,但是藏词之间却不像英文单词一样有分隔标记,如图2.2所示为藏词示例。藏语总有15个元音,7个辅音韵尾,48个韵母,当代藏语拉萨音有四个声调,分别为高调、低调、降调和升调。图2.1藏字的组成结构图2.2藏词示例的组成结构2.2深度神经网络模型2.2.1卷积神经网络CNN模型结构图如图2.3所示,主要有三层构成[37]。
第2章基于深度学习的藏语文本分析相关问题7输入层:假如一个藏语句子有n个特征词且该词向量维度是k,那么输入的词向量矩阵为nk。卷积层:主要对藏文文本进行卷积运算,如式(2-1)所示。ii:11()iihCfWXb+=+(2-1)此中,结果用iC表示,h为窗口大小,词向量矩阵是i:i+h-1X,卷积核是1W,1b为偏置量,f为relu激活函数。池化层:上一层运算后的结果iC输入到池化层,对特征iC进行压缩。输出层:输入池化层的输出特征向量,通过类别概率计算,得到最终的预测类别yi定义如(2-2)所示:33ymax()iii=softWh+b(2-2)其中,3W为类别权值矩阵,3b为偏置量。图2.3CNN模型结构图2.2.2递归神经网络语言之间存在着相关性,尤其是上一个词和下一个词之间联系性更强。研究者为了能更好地解决文本语义之间的关系,提出了递归神经网络(Recurrentneuralnet,RNN),结构展开图如图2.4所示,因为RNN模型中增加了可以识别自然语言依赖关系循环结构。由于该特殊循环结构的存在保证了隐藏层中节点能够相互连接,也保证了上文中分析出来的信息能够传递到下文中,保留全文信息展开总体性的分析[38]。图2.4RNN模型展开图
【参考文献】:
期刊论文
[1]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[2]基于SVM藏文文本分类的研究与实现[J]. 贾宏云,群诺,苏慧婧,次仁罗增,巴桑卓玛. 电子技术与软件工程. 2018(09)
[3]基于深度学习的藏文分词方法[J]. 李博涵,刘汇丹,龙从军,吴健. 计算机工程与设计. 2018(01)
[4]藏语口语语音语料库的设计与研究[J]. 黄晓辉,李京,马睿. 计算机工程与应用. 2018(13)
[5]面向汉语统计参数语音合成的标注生成方法[J]. 郝东亮,杨鸿武,张策,张帅,郭立钊,杨静波. 计算机工程与应用. 2016(19)
[6]TIP-LAS:一个开源的藏文分词词性标注系统[J]. 李亚超,江静,加羊吉,于洪志. 中文信息学报. 2015(06)
[7]基于知识融合的CRFs藏文分词系统[J]. 洛桑嘎登,杨媛媛,赵小兵. 中文信息学报. 2015(06)
[8]基于深度神经网络的汉语语音合成的研究[J]. 王坚,张媛媛. 计算机科学. 2015(S1)
[9]判别式藏语文本词性标注研究[J]. 华却才让,刘群,赵海兴. 中文信息学报. 2014(02)
[10]融合音节特征的最大熵藏文词性标注研究[J]. 于洪志,李亚超,汪昆,冷本扎西. 中文信息学报. 2013(05)
博士论文
[1]藏语分词与词性标注研究[D]. 康才畯.上海师范大学 2014
本文编号:3491856
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3491856.html