一种用于英语语法错误纠正的层次语言模型的研究与设计
发布时间:2018-05-31 14:48
本文选题:语法错误 + 纠正 ; 参考:《中国科学技术大学》2017年硕士论文
【摘要】:近些年,英语语法错误纠正领域快速发展,产生了很多优秀的成果,但是在语言模型的设计上却没有大的突破。传统的n-gram模型对于语言纠错没有很强的针对性,新提出的句法n-gram模型纠错和一些新出现的树状语言模型纠错效果不太理想,基于神经网络的语言模型太过复杂。因而,本文的目标是综合现有常见语言模型的优点,在资源比较有限的条件下,研究和设计一种可以应用于英语语法错误纠正系统的层次语言模型。为了取得比传统语言模型更理想的语法错误纠正效果,首先,本文分析了目前常见的几种语言模型的特点,提出了一种既可以克服远距离单词间依赖问题又能兼顾保存语义信息的层次语言模型。该语言模型利用句中单词之间的依存关系,将句子分解成不同层次的子句,子句内部高度相关,上下层子句之间相互修饰和补充。其次,训练该层次语言模型,设计纠正解码算法,利用近似单词作为备选词,使用模型的概率信息进行纠正解码,并依此实现了一个覆盖多种英语语法错误的通用语法错误纠正模块;然后,采用该层次语言模型提取句子的上下文信息作为分类器的特征,利用近似动名词搭配作为备选搭配集,对搭配集进行筛选,并使用该语言模型对纠错结果进行最终排序,并依此设计了一个针对英语动名词搭配错误的纠正模块。最后,对这两个模块的纠错效果进行了测评。经过实验验证,本文提出的层次语言模型具有稳定性和简洁性等优点,对句子的描述也更加精确。将层次语言模型直接用于构建解码器对多种英语语法错误进行检错纠错,或者用于抽取上下文特征作为英语语法检错纠错中机器学习的特征,或者运用于对纠错结果进行评分和排序,均能取得比传统线性语言模型更好的效果。
[Abstract]:In recent years , the fast development in the field of English grammar error correction has produced many excellent results , but there is no big breakthrough in the design of the language model .
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1
【参考文献】
相关期刊论文 前3条
1 杜一民;吴桂兴;吴敏;;一种解决英语动名词搭配错误的模型[J];计算机科学;2016年07期
2 鉴萍;宗成庆;;基于序列标注模型的分层式依存句法分析方法[J];中文信息学报;2010年06期
3 张钹;;自然语言处理的计算模型[J];中文信息学报;2007年03期
相关硕士学位论文 前3条
1 陈朝才;英语搭配错误检测与纠正系统的研究与实现[D];中国科学技术大学;2015年
2 葛昊;基于N-gram语法检查系统的改进和实现[D];中国科学技术大学;2014年
3 曹莉;基于语料库的中国大学生英语四、六级考试作文中动名搭配错误分析[D];华中科技大学;2007年
,本文编号:1960172
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1960172.html
最近更新
教材专著