基于神经机器翻译的中文文本纠错研究

发布时间：2021-09-28 10:00

　　随着中国经济的蓬勃发展,越来越多的外国人开始学习汉语,但是学习汉语对他们来说并不容易,因此检测并纠正由CSL（Chinese as a Second Language）学习者撰写的中文文章中的语法错误显得越来越重要,有效的中文语法错误纠正（CGEC）系统可以为CSL学习者提供即时反馈,在学习过程中具有重要价值。主流的CGEC模型是基于神经机器翻译（NMT）的纠错模型,但是并没有针对CGEC的特点进行优化。本文基于CGEC任务的特点,使用了不同的嵌入层参数初始化方式,并改进了NMT模型,在解码器中使用多层target-attention计算方式。本文主要工作如下:1.提出不同的嵌入层参数初始化方式。在基于NMT的CGEC模型中,嵌入层参数通常使用预训练的词向量初始化。但是CSL学习者和母语使用者的语言习惯并不相同,并且预训练词向量通常是在大规模的中文语料上训练得到的。因此本文提出不同的嵌入层参数初始化方式,编码端使用随机初始化,解码端使用预训练词向量初始化。实验结果表明,该初始化方式使模型的纠错性能提升了1.48 F_0.5。2.在NMT模型的基础上,提出多层targ...

【文章来源】：武汉大学湖北省 211工程院校 985工程院校教育部直属院校

【文章页数】：69 页

【学位级别】：硕士

【部分图文】：

基于神经机器翻译的中文文本纠错研究

文本卷积操作结构示意图

基于神经机器翻译的中文文本纠错研究

seq2seq模型结构示意图

基于神经机器翻译的中文文本纠错研究

AttentionMechanism模块示意图

【参考文献】：
期刊论文
[1]基于规则与统计相结合的中文文本自动查错模型与算法[J]. 张仰森,曹元大,俞士汶. 中文信息学报. 2006(04)
[2]现代汉语熵的计算及语言模型中稀疏事件的概率估计[J]. 黄萱菁,吴立德,郭以昆,刘秉伟. 电子学报. 2000(08)

本文编号：3411695

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3411695.html

上一篇：基于UTXO模型的区块链交易算法的研究与实现
下一篇：多功能分拣车系统设计

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|