基于神经机器翻译的中文文本纠错研究
发布时间:2021-09-28 10:00
随着中国经济的蓬勃发展,越来越多的外国人开始学习汉语,但是学习汉语对他们来说并不容易,因此检测并纠正由CSL(Chinese as a Second Language)学习者撰写的中文文章中的语法错误显得越来越重要,有效的中文语法错误纠正(CGEC)系统可以为CSL学习者提供即时反馈,在学习过程中具有重要价值。主流的CGEC模型是基于神经机器翻译(NMT)的纠错模型,但是并没有针对CGEC的特点进行优化。本文基于CGEC任务的特点,使用了不同的嵌入层参数初始化方式,并改进了NMT模型,在解码器中使用多层target-attention计算方式。本文主要工作如下:1.提出不同的嵌入层参数初始化方式。在基于NMT的CGEC模型中,嵌入层参数通常使用预训练的词向量初始化。但是CSL学习者和母语使用者的语言习惯并不相同,并且预训练词向量通常是在大规模的中文语料上训练得到的。因此本文提出不同的嵌入层参数初始化方式,编码端使用随机初始化,解码端使用预训练词向量初始化。实验结果表明,该初始化方式使模型的纠错性能提升了1.48 F0.5。2.在NMT模型的基础上,提出多层targ...
【文章来源】:武汉大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
文本卷积操作结构示意图
seq2seq模型结构示意图
AttentionMechanism模块示意图
【参考文献】:
期刊论文
[1]基于规则与统计相结合的中文文本自动查错模型与算法[J]. 张仰森,曹元大,俞士汶. 中文信息学报. 2006(04)
[2]现代汉语熵的计算及语言模型中稀疏事件的概率估计[J]. 黄萱菁,吴立德,郭以昆,刘秉伟. 电子学报. 2000(08)
本文编号:3411695
【文章来源】:武汉大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
文本卷积操作结构示意图
seq2seq模型结构示意图
AttentionMechanism模块示意图
【参考文献】:
期刊论文
[1]基于规则与统计相结合的中文文本自动查错模型与算法[J]. 张仰森,曹元大,俞士汶. 中文信息学报. 2006(04)
[2]现代汉语熵的计算及语言模型中稀疏事件的概率估计[J]. 黄萱菁,吴立德,郭以昆,刘秉伟. 电子学报. 2000(08)
本文编号:3411695
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3411695.html
最近更新
教材专著