英语作文自动评分关键技术的研究与实现
发布时间:2021-08-18 05:04
英语作文可以考察英语学习者的语言综合运用能力,在平时的学习中,一般都是老师人工评阅,这种评阅方法主观性强,阅卷强度大使得评卷效率低、误判率高。计算机技术的发展加快了AES(作文自动评分,Automated Essay Scoring)技术研究与应用的进程,这种技术可以对作文进行分析和打分,相比人工评阅,计算机评分成本低、审阅效率高,同时可以反馈更多的评价信息,比如每篇作文的单词拼写、语法错误等,还可以推荐优秀的词句和作文素材,为学习者提供更科学地作文写作指导意见。然而,目前AES系统的构建和评价大部分基于论文内容的统计信息,对于作文的逻辑、词句的质量等评估仍不够深入和准确。因此,在提高预测分值的准确度的同时,也要对作文内容全面评价,以使得AES系统更好地应用于实际作文批改当中。本文研究了AES相关技术,设计了特征的提取模型并讨论了集成学习方法。首先,本文构建了AES总体模型,并分析对比关键技术的一系列仿真实验;然后,引入句子优美性识别模型,通过调研确定优美性的评价标准,并在网络上收集大量的原始数据,然后人工制定特征提取方案并融入卷积神经网络当中训练句子优美性识别模型,通过优美性识别模型...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图1.1研宂思路图??本文的主要工作如下:??(1)明确研宄现状以确定本文的研宄内容
第2章英语AES模型总体设计??2.1评分模型的基本框架??本章AES模型总体设计如图2.1所示。??它主要由四大部分构成,分别是数据清洗及处理模块、文本语义特征生成模块、??语言学特征生成模块以及预测模块。??数据清洗及处理模块包括分词,大小写转换,去除停用词及标点符号等一系列??步骤。英文写作中,每个单词以空格分开,因此在分词的时候通过空格将句子分词;??句子第一个单词的首字母通常是大写的,且有些单词被大写以重点强调和区别,从??计算机的角度来看是没法区别’Bike’、‘bike’、‘BIKE’是否为同一个意思,所以我们??通常将文本中的字母转换为小写;停用词是无含义的词,例如‘is’、‘our’、‘the’、‘in’、??‘at’等。它们不会给句子增加太多含义。为了减少需要处理的词汇量,从而降低后??续程序的复杂性
学位论文??TER'S?THESIS??文集中的作文文本4?(4eW,4,式,…X]):??(1)获取作文4的词向量集;??(2)并统计不同聚类簇下词向量的个数分布;??(3)返回个数分布将其作为词向量聚类特征???ax(/(A〇)时,*?=尺,此时/(幻为适应度函数最大值。经过本聚类模型并由计算可知,当K=30时适应度函数有最大值递增,於欠时单调递减,/幻随聚类簇的个数々值的变化曲
本文编号:3349251
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图1.1研宂思路图??本文的主要工作如下:??(1)明确研宄现状以确定本文的研宄内容
第2章英语AES模型总体设计??2.1评分模型的基本框架??本章AES模型总体设计如图2.1所示。??它主要由四大部分构成,分别是数据清洗及处理模块、文本语义特征生成模块、??语言学特征生成模块以及预测模块。??数据清洗及处理模块包括分词,大小写转换,去除停用词及标点符号等一系列??步骤。英文写作中,每个单词以空格分开,因此在分词的时候通过空格将句子分词;??句子第一个单词的首字母通常是大写的,且有些单词被大写以重点强调和区别,从??计算机的角度来看是没法区别’Bike’、‘bike’、‘BIKE’是否为同一个意思,所以我们??通常将文本中的字母转换为小写;停用词是无含义的词,例如‘is’、‘our’、‘the’、‘in’、??‘at’等。它们不会给句子增加太多含义。为了减少需要处理的词汇量,从而降低后??续程序的复杂性
学位论文??TER'S?THESIS??文集中的作文文本4?(4eW,4,式,…X]):??(1)获取作文4的词向量集;??(2)并统计不同聚类簇下词向量的个数分布;??(3)返回个数分布将其作为词向量聚类特征???ax(/(A〇)时,*?=尺,此时/(幻为适应度函数最大值。经过本聚类模型并由计算可知,当K=30时适应度函数有最大值递增,於欠时单调递减,/幻随聚类簇的个数々值的变化曲
本文编号:3349251
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3349251.html
最近更新
教材专著