基于中文多维度特征指标的小学写作自动反馈研究
发布时间:2021-07-31 04:25
一直以来,语文写作在整个语文课程学习当中占有着非常重要的位置,是培养学生综合素养的重要教学内容之一。在传统的语文写作教学中,由于教师批改作文比较费时费力,因而学生无法及时得到反馈结果;此外,由于疲劳或个人感情等因素使得教师批改存在一定的主观性。所以如何利用计算机解决传统人工评价作文存在的问题显得颇为重要。随着自然语言处理、机器学习等技术的快速发展,利用计算机进行作文自动评价变的更加可行。因此,本文开发一个基于中文多维度特征指标的小学写作自动反馈系统,希望通过自动反馈的方式辅助学生进行作文评价与修改,并以武汉市某所小学六年级学生为例,进行自动反馈写作的研究,主要研究内容和成果包含以下三个方面:第一,从字词基础、篇章结构、语言表达和情感主题四个维度,提出了符合小学阶段语文作文评价的120个特征指标。采用自然语言处理等技术,将收集的4193篇作文作为语料,按照浅层语言特征和深层语言特征的面向进行特征的提取;并采用特征向量空间模型(F-VSM)和支持向量机(SVM)两种算法进行指标可靠性的验证。其中,基于浅层特征F-VSM与SVM算法的分类准确率分别为63.67%和72.03%;基于深层特征F...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
图1.1论文研宄框架??1.3.2研究方法??本文主要采用了文献研宄法、实验分析法、实证研究法和问卷调裔法叫种研??究方法,其详细论述如下:??4??
3.1.4?LDA主题模型??潜在狄利克雷分布(Latent?Dirichlet?Allocation,?LDA)是一种文档主题生成模??型,也称为一个三层贝叶斯概率模型[631,其模型如图3.丨所示,由词、主题和文??档三层结构组成,图中各个符号的含义见表3.1所示。??k#郏欤辏荩崳?\????(^)?^?eA??>?Zd,n??^?^d,n??化[1川?M??图3.1?LDA概率模型图??潜在狄利克雷分布的主要思想是一篇文档存在多个主题,每个主题下对应着??许多不同的词。一篇文档的生成过程,首先是根据先验概率选择某个主题,然后??再在这个主题下根据特定的几率选出某一个沏,这样就生成了这篇文裆的第一个??词,不停地循环上述步骤,就完成了整篇文捫的构造。而LDA原理的过程是上??述文档生成的反过程,即最初给定一篇文档,找出这篇文档所包含的主题,以及??每个K题下对应的词与相应的概率。LDA主题模型应用广泛
图3.2支持向量机超平面分类原理??有研究表明,SVM用于文本分类有很好的效果1?1。因此,本文采用SVM分??类模型,其模型的训练和分类过程如图3.3所示。??;|」?-||?????????j??m?j一一??5[处逐揆块一?特征抽取夜块—商量化筷块一??!?h[^]!??丨」???|??图3.3支持向蛩机模型训练图??3.2作文特征指标的提取??本文结合传统作文评价标准和国内外作文特征指标的研宄,采用自然语言处??理等技术对作文特征进行提取,提取过程分为两个阶段:第一个阶段是只提取了??浅层面向的语言特征,第二个阶段对深层语言特征进行提取。浅层语言特征是指??单一的、只从字词、句法等维度考虑的特征。深层语言特征是指U合的、包括内??容、篇章结构、语言、怙感:丨:题等维度的特征。第一阶段考虑的特征比较基础,??笫..阶段提収的特征足对第一阶段的补充和深入,经过两次的特征提取,特征选??取更加全面合理。??18??
本文编号:3312764
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:62 页
【学位级别】:硕士
【部分图文】:
图1.1论文研宄框架??1.3.2研究方法??本文主要采用了文献研宄法、实验分析法、实证研究法和问卷调裔法叫种研??究方法,其详细论述如下:??4??
3.1.4?LDA主题模型??潜在狄利克雷分布(Latent?Dirichlet?Allocation,?LDA)是一种文档主题生成模??型,也称为一个三层贝叶斯概率模型[631,其模型如图3.丨所示,由词、主题和文??档三层结构组成,图中各个符号的含义见表3.1所示。??k#郏欤辏荩崳?\????(^)?^?eA??>?Zd,n??^?^d,n??化[1川?M??图3.1?LDA概率模型图??潜在狄利克雷分布的主要思想是一篇文档存在多个主题,每个主题下对应着??许多不同的词。一篇文档的生成过程,首先是根据先验概率选择某个主题,然后??再在这个主题下根据特定的几率选出某一个沏,这样就生成了这篇文裆的第一个??词,不停地循环上述步骤,就完成了整篇文捫的构造。而LDA原理的过程是上??述文档生成的反过程,即最初给定一篇文档,找出这篇文档所包含的主题,以及??每个K题下对应的词与相应的概率。LDA主题模型应用广泛
图3.2支持向量机超平面分类原理??有研究表明,SVM用于文本分类有很好的效果1?1。因此,本文采用SVM分??类模型,其模型的训练和分类过程如图3.3所示。??;|」?-||?????????j??m?j一一??5[处逐揆块一?特征抽取夜块—商量化筷块一??!?h[^]!??丨」???|??图3.3支持向蛩机模型训练图??3.2作文特征指标的提取??本文结合传统作文评价标准和国内外作文特征指标的研宄,采用自然语言处??理等技术对作文特征进行提取,提取过程分为两个阶段:第一个阶段是只提取了??浅层面向的语言特征,第二个阶段对深层语言特征进行提取。浅层语言特征是指??单一的、只从字词、句法等维度考虑的特征。深层语言特征是指U合的、包括内??容、篇章结构、语言、怙感:丨:题等维度的特征。第一阶段考虑的特征比较基础,??笫..阶段提収的特征足对第一阶段的补充和深入,经过两次的特征提取,特征选??取更加全面合理。??18??
本文编号:3312764
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3312764.html