基于迁移学习的缅甸语依存句法分析方法研究
发布时间:2021-05-14 10:38
依存句法分析是自然语言处理的重要研究任务,由于缅甸语为资源稀缺语言,人工标注大规模的缅语依存句法分析数据存在较大困难。本文利用英语的依存标注数据,通过迁移学习方法解决缅甸语依存句法分析问题,研究具有一定的学术意义。本文分析了缅甸语、英语在句法方面的差异性,提出了基于共享网络参数的缅甸语依存句法分析方法,提出了基于迁移学习的缅甸语依存句法分析方法。实验证明提出的方法在标注数据较少的情况下能够有效提升缅甸语依存句法分析的性能。本文取得了以下几方面的成果:(1)英缅句法差异性分析及语料库构建。分析了缅甸句法特点,研究了英缅句法之间的差异并分析了英缅句法结构的对应关系。结合英缅句法差异性利用从亚洲语言树库获取的20106对英-缅平行对齐语料,本文构建出1766句符合依存句法分析规则的缅甸语依存句法分析语料,17688条不符合依存句法分析规则的缅甸语依存句法分析语料。(2)基于共享网络参数的缅甸语依存句法分析方法。针对缅甸语依存句法分析语料不足的问题,本文提出共享网络参数的缅甸语依存句法分析方法。首先利用双语词典将英缅双语词向量映射到相同的语义空间中,然后基于斯坦福依存句法分析器使用大量的英语标...
【文章来源】:昆明理工大学云南省
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文的主要研究内容
1.4 本文的组织结构
第二章 英缅句法差异性分析及语料库构建
2.1 引言
2.2 缅甸语的句法特点
2.2.1 缅甸语句法结构
2.2.2 缅甸语句法特征
2.3 英语缅甸语句子对应关系
2.3.1 缅甸语的句法成分分析
2.3.2 英缅句子成分对比
2.4 基于词映射构建缅甸语依存句法分析
2.4.1 生成英语依存句法分析标记语料
2.4.2 获取英缅对齐的句子中的词对应关系
2.4.3 获取缅甸语标记的依存关系语料
2.5 总结
第三章 基于共享网络参数的缅甸语依存句法分析方法
3.1 引言
3.2 相关研究
3.3 共享网络参数的缅甸语依存句法分析模型
3.4 共享英缅词向量空间
3.4.1 利用正交性约束映射矩阵
3.4.2 数值归一化
3.4.3 迭代更新双语词典
3.5 共享网络参数的模型训练
3.5.1 实验语料的准备
3.5.2 共享词向量语义空间
3.5.3 依存句法分析过程
3.5.4 共享网络参数的缅甸依存句法分析模型训练
3.6 实验
3.6.1 依存句法分析的评价指标
3.6.2 实验及结果分析
3.7 本章小结
第四章 基于迁移学习的缅甸语依存句法分析方法
4.1 引言
4.2 相关研究
4.3 基于迁移学习的缅甸语依存句法分析模型
4.4 缅语词分析
4.4.1 融合缅语音节特征的缅甸语词向量训练模型
4.4.2 缅语词汇的向量初始化
4.4.3 卷积层提取缅语音节特征
4.4.4 门结构网络进一步提取特征
4.4.5 递归神经网络构建语言模型
4.5 特征信息的迁移
4.5.1 Skip-gram
4.5.2 训练词性标签的向量
4.5.3 融合缅甸语语法的迁移训练方法
4.5.4 依存弧、词性、位置信息的迁移
4.6 迁移学习的模型训练
4.6.1 输入层
4.6.2 激活函数
4.6.3 损失函数
4.7 实验及结果分析
4.7.1 实验数据
4.7.2 实验及结果分析
4.8 本章小结
第五章 缅甸语依存句法分析原型系统的实现
5.1 系统简介
5.2 实验开发环境
5.2.1 软件环境
5.2.2 硬件环境
5.3 缅甸语依存句法分析模型
5.3.1 数据的预处理
5.3.2 训练所需的标注语料
5.3.3 获得缅甸语依存句法分析模型
5.4 原型系统
5.5 本章小结
第六章 总结和展望
6.1 总结
6.2 展望
致谢
参考文献
附录
【参考文献】:
期刊论文
[1]基于语言学的依存分析结果动宾关系补全研究[J]. 张丹,周俏丽,张桂平. 计算机应用研究. 2018(04)
[2]语音识别技术研究进展[J]. 詹新明,黄南山,杨灿. 现代计算机(专业版). 2008(09)
[3]自然语言处理在信息检索中的应用综述[J]. 王灿辉,张敏,马少平. 中文信息学报. 2007(02)
[4]机器翻译研究现状与展望[J]. 戴新宇,尹存燕,陈家骏,郑国梁. 计算机科学. 2004(11)
硕士论文
[1]基于神经网络的汉缅双语句子级Embedding语义表征方法应用研究[D]. 林颂凯.昆明理工大学 2018
[2]基于汉-缅双语语料的双语实体抽取方法研究[D]. AUNG HLA MOE(张家富).昆明理工大学 2018
[3]越南语句法分析与树库转化方法研究[D]. 李英.昆明理工大学 2017
[4]融合多特征的汉缅双语主题模型构建方法研究[D]. 王雍凯.昆明理工大学 2017
[5]缅甸语词法分析方法研究[D]. 韩晓东.昆明理工大学 2016
[6]基于序列标注的中文依存句法分析研究[D]. 计峰.复旦大学 2008
本文编号:3185501
【文章来源】:昆明理工大学云南省
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文的主要研究内容
1.4 本文的组织结构
第二章 英缅句法差异性分析及语料库构建
2.1 引言
2.2 缅甸语的句法特点
2.2.1 缅甸语句法结构
2.2.2 缅甸语句法特征
2.3 英语缅甸语句子对应关系
2.3.1 缅甸语的句法成分分析
2.3.2 英缅句子成分对比
2.4 基于词映射构建缅甸语依存句法分析
2.4.1 生成英语依存句法分析标记语料
2.4.2 获取英缅对齐的句子中的词对应关系
2.4.3 获取缅甸语标记的依存关系语料
2.5 总结
第三章 基于共享网络参数的缅甸语依存句法分析方法
3.1 引言
3.2 相关研究
3.3 共享网络参数的缅甸语依存句法分析模型
3.4 共享英缅词向量空间
3.4.1 利用正交性约束映射矩阵
3.4.2 数值归一化
3.4.3 迭代更新双语词典
3.5 共享网络参数的模型训练
3.5.1 实验语料的准备
3.5.2 共享词向量语义空间
3.5.3 依存句法分析过程
3.5.4 共享网络参数的缅甸依存句法分析模型训练
3.6 实验
3.6.1 依存句法分析的评价指标
3.6.2 实验及结果分析
3.7 本章小结
第四章 基于迁移学习的缅甸语依存句法分析方法
4.1 引言
4.2 相关研究
4.3 基于迁移学习的缅甸语依存句法分析模型
4.4 缅语词分析
4.4.1 融合缅语音节特征的缅甸语词向量训练模型
4.4.2 缅语词汇的向量初始化
4.4.3 卷积层提取缅语音节特征
4.4.4 门结构网络进一步提取特征
4.4.5 递归神经网络构建语言模型
4.5 特征信息的迁移
4.5.1 Skip-gram
4.5.2 训练词性标签的向量
4.5.3 融合缅甸语语法的迁移训练方法
4.5.4 依存弧、词性、位置信息的迁移
4.6 迁移学习的模型训练
4.6.1 输入层
4.6.2 激活函数
4.6.3 损失函数
4.7 实验及结果分析
4.7.1 实验数据
4.7.2 实验及结果分析
4.8 本章小结
第五章 缅甸语依存句法分析原型系统的实现
5.1 系统简介
5.2 实验开发环境
5.2.1 软件环境
5.2.2 硬件环境
5.3 缅甸语依存句法分析模型
5.3.1 数据的预处理
5.3.2 训练所需的标注语料
5.3.3 获得缅甸语依存句法分析模型
5.4 原型系统
5.5 本章小结
第六章 总结和展望
6.1 总结
6.2 展望
致谢
参考文献
附录
【参考文献】:
期刊论文
[1]基于语言学的依存分析结果动宾关系补全研究[J]. 张丹,周俏丽,张桂平. 计算机应用研究. 2018(04)
[2]语音识别技术研究进展[J]. 詹新明,黄南山,杨灿. 现代计算机(专业版). 2008(09)
[3]自然语言处理在信息检索中的应用综述[J]. 王灿辉,张敏,马少平. 中文信息学报. 2007(02)
[4]机器翻译研究现状与展望[J]. 戴新宇,尹存燕,陈家骏,郑国梁. 计算机科学. 2004(11)
硕士论文
[1]基于神经网络的汉缅双语句子级Embedding语义表征方法应用研究[D]. 林颂凯.昆明理工大学 2018
[2]基于汉-缅双语语料的双语实体抽取方法研究[D]. AUNG HLA MOE(张家富).昆明理工大学 2018
[3]越南语句法分析与树库转化方法研究[D]. 李英.昆明理工大学 2017
[4]融合多特征的汉缅双语主题模型构建方法研究[D]. 王雍凯.昆明理工大学 2017
[5]缅甸语词法分析方法研究[D]. 韩晓东.昆明理工大学 2016
[6]基于序列标注的中文依存句法分析研究[D]. 计峰.复旦大学 2008
本文编号:3185501
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3185501.html
最近更新
教材专著