基于神经机器翻译的中文文本纠错研究

发布时间:2021-09-28 10:00
  随着中国经济的蓬勃发展,越来越多的外国人开始学习汉语,但是学习汉语对他们来说并不容易,因此检测并纠正由CSL(Chinese as a Second Language)学习者撰写的中文文章中的语法错误显得越来越重要,有效的中文语法错误纠正(CGEC)系统可以为CSL学习者提供即时反馈,在学习过程中具有重要价值。主流的CGEC模型是基于神经机器翻译(NMT)的纠错模型,但是并没有针对CGEC的特点进行优化。本文基于CGEC任务的特点,使用了不同的嵌入层参数初始化方式,并改进了NMT模型,在解码器中使用多层target-attention计算方式。本文主要工作如下:1.提出不同的嵌入层参数初始化方式。在基于NMT的CGEC模型中,嵌入层参数通常使用预训练的词向量初始化。但是CSL学习者和母语使用者的语言习惯并不相同,并且预训练词向量通常是在大规模的中文语料上训练得到的。因此本文提出不同的嵌入层参数初始化方式,编码端使用随机初始化,解码端使用预训练词向量初始化。实验结果表明,该初始化方式使模型的纠错性能提升了1.48 F0.5。2.在NMT模型的基础上,提出多层targ... 

【文章来源】:武汉大学湖北省 211工程院校 985工程院校 教育部直属院校

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

基于神经机器翻译的中文文本纠错研究


文本卷积操作结构示意图

基于神经机器翻译的中文文本纠错研究


seq2seq模型结构示意图

基于神经机器翻译的中文文本纠错研究


AttentionMechanism模块示意图

【参考文献】:
期刊论文
[1]基于规则与统计相结合的中文文本自动查错模型与算法[J]. 张仰森,曹元大,俞士汶.  中文信息学报. 2006(04)
[2]现代汉语熵的计算及语言模型中稀疏事件的概率估计[J]. 黄萱菁,吴立德,郭以昆,刘秉伟.  电子学报. 2000(08)



本文编号:3411695

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3411695.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5229a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com