当前位置:主页 > 教育论文 > 教育教学论文 >

基于N-gram语法检查系统的改进和实现

发布时间:2017-04-20 12:02

  本文关键词:基于N-gram语法检查系统的改进和实现,由笔耕文化传播整理发布。


【摘要】:英语作文体现了英语的书写能力,是英语能力中的重要一部分,在作文的学习过程中,需要进行大量的写作练习,而产生的大量练习作文同英语老师数量相对较少形成了矛盾,很多练习作文由于无法得到及时的批阅而使得英语学习效果减弱。为此利用计算机辅助进行作文批阅显得非常必要。语法检查是作文批阅中的重要部分,在此之前,王全斌就基于N元语法的语法检查系统做了如下工作:对N元语法模型的调研,对系统的实现流程和基础算法的设计、对语料库的训练和对系统的实现以及对语法检查效果的验证,该系统只是实现了单词的二元语法检查,而且检查算法较为简单。本文的目标是在已有的基础上对基于N元语法的语法检查系统进行改进。 为了能够进一步提高N元语法检查系统的检查效果,本文对N元语法模型和语法检查的算法做了进一步的研究,并在原系统的基础上从以下三个方面对原系统进行了改进:1.在训练阶段添加了对词性标注的N元语法训练;2.对训练后的数据进行了平滑处理;3.优化了语法检查算法,添加了对单词的三元语法以及词性标注的二元至五元语法的检查,并优化了判错机制。本文的工作主要是对训练系统和检查系统两大模块进行改进和实现。其中训练系统的改进和实现包括了语料库的选择、训练算法的改进和实现、数据库的表和字段的重新设计、核心类的改进和实现。检查系统的改进和实现包括了核心算法的改进和实现、核心类的改进和实现。 在系统实现之后,本文以CLEC语料库为基础对系统的准确率和召回率进行了验证,实验的结果表明系统的准确度提高了2%,而系统的召回率提高了10%。较之前的系统整体效果提升明显。
【关键词】:英语 语法检查 N元语法
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:H319;G434
【目录】:
  • 摘要5-6
  • Abstract6-9
  • 第一章 绪论9-15
  • 1.1 问题提出9-10
  • 1.2 国内外研究现状10-12
  • 1.3 本文主要工作和章节结构12-15
  • 1.3.1 本文研究问题及主要工作12-13
  • 1.3.2 本文章节结构13-15
  • 第二章 相关理论和技术分析15-33
  • 2.1 语料处理理论技术15-24
  • 2.1.1 英文分词15-16
  • 2.1.2 词性标注技术16-18
  • 2.1.3 语料库18-19
  • 2.1.4 平滑算法19-22
  • 2.1.5 句法分析22-24
  • 2.2 语法检查基本理论技术24-30
  • 2.2.1 马尔科夫模型24-25
  • 2.2.2 N元语法模型25-27
  • 2.2.3 语法检查基本算法27-30
  • 2.3 本章小结30-33
  • 第三章 系统改进的设计与实现33-57
  • 3.1 语法检查系统概述33-34
  • 3.2 训练模块改进与实现34-48
  • 3.2.1 训练模块流程34-35
  • 3.2.2 数据库的设计35-39
  • 3.2.3 核心类的改进与实现39-42
  • 3.2.4 训练模块中的核心算法改进42-45
  • 3.2.5 改进后的训练过程的实现45-48
  • 3.2.6 训练结果48
  • 3.3 语法检查模块的改进与实现48-54
  • 3.3.1 改进的语法检查模块的基本流程48-49
  • 3.3.2 核心类的改进与实现49-50
  • 3.3.3 检查模块中的核心算法设计50-53
  • 3.3.4 改进的语法检查过程的实现53-54
  • 3.4 本章小结54-57
  • 第四章 系统的效果和验证57-61
  • 4.1 语法检查效果的评测标准57-58
  • 4.2 系统检查效果验证58-59
  • 4.3 实验结果分析59-60
  • 4.4 本章小结60-61
  • 第五章 总结和展望61-65
  • 5.1 结论和总结61-62
  • 5.2 后续的工作展望62-63
  • 5.3 本章小结63-65
  • 参考文献65-67
  • 致谢67-69
  • 在读期间发表的学术论文与取得的其他研究成果69

【参考文献】

中国期刊全文数据库 前4条

1 谢坤武;;基于实例的语法检查研究[J];湖北民族学院学报(自然科学版);2009年01期

2 吕威;林文昶;姚正安;李磊;;基于String Kernel和KPCA的负实例语法特征提取算法[J];计算机工程与应用;2009年20期

3 吴应中;朱华勇;李杰;;基于n元语法模型的领域语音指令识别[J];微计算机信息;2009年14期

4 吴夙慧;成颖;郑彦宁;潘云涛;;基于N元语法的英文学术文献聚类标签抽取算法[J];现代图书情报技术;2011年Z1期


  本文关键词:基于N-gram语法检查系统的改进和实现,,由笔耕文化传播整理发布。



本文编号:318607

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyujiaoxuefangfalunwen/318607.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户550f5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com