简答题自动评分方法研究

发布时间:2021-04-06 13:27
  自动评分任务是给定学生答案,要求计算机依据参考答案预测对应分值。自动评分是智慧教育的一个研究热点,可以有效增加评分一致性。本文以中文简答题自动评分作为研究对象,对其进行分析与研究,主要工作如下:(1)基于注意力机制的自动评分策略。本文使用注意力机制刻画学生答案与参考答案的语义匹配情况,实现了自动评分模型Att-Grader。该模型首先通过长短期记忆网络对学生答案与参考答案进行序列编码;然后,利用互注意力机制进一步捕获二者的语义信息,最后通过卷积神经网络预测分值。中文数据集的实验结果表明:引入注意力机制的评分模型相较于基线模型在准确率评价指标上提高了1.9%-14.7%。(2)基于参考答案集构建的自动评分策略。针对参考答案不能完全覆盖多样性的学生答案的问题,本文提出构建参考答案集扩充原有参考答案的思想。具体为:首先对满分学生答案进行聚类;其次通过相似度计算得出每一簇的代表性答案;最后将代表性答案组合为参考答案集。将参考答案集与Att-Grader评分模型相结合,对学生答案进行分值预测,在中文数据集上进行实验,结果显示:融入参考答案集的Att-Grader评分模型在准确率评价指标上最大提升... 

【文章来源】:山西大学山西省

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

简答题自动评分方法研究


注意力机制可视化

聚类,数据集,答案,语文


第四章基于数据增强的自动评分策略25一个综合的层次聚类算法,采用聚类特征和聚类特征树进行聚类描述。我们在聚类簇数K分别为[3,6,9,12,15,18,21,24,27]的情况下比较了这两种方法在语文数据集上的聚类效果,采用轮廓系数的平均值为评价指标。具体如图3所示。由图4.3可知,k-means聚类算法在语文数据集上(CRCC1-CRCC3)的轮廓系数均值远远高于Birch算法,因此本文选择k-means作为聚类算法对学生答案进行聚类。图4.3聚类方法的比较2)聚类簇数的选择由图4.4可知,k-means算法在数据集CRCC1、CRCC2、CRCC3上的聚类簇数K分别为6、12、3时,轮廓系数值较高,表明聚类效果较好。图4.4不同聚类簇数下的聚类效果4.4.2自动评分实验聚类之后,对每个簇进行代表性答案选择,构建参考答案集。表4.2为CRCC1数据集对应的参考答案集。学生答案①从历史背景角度介绍,②从人物性格方面介

效果图,聚类,效果


第四章基于数据增强的自动评分策略25一个综合的层次聚类算法,采用聚类特征和聚类特征树进行聚类描述。我们在聚类簇数K分别为[3,6,9,12,15,18,21,24,27]的情况下比较了这两种方法在语文数据集上的聚类效果,采用轮廓系数的平均值为评价指标。具体如图3所示。由图4.3可知,k-means聚类算法在语文数据集上(CRCC1-CRCC3)的轮廓系数均值远远高于Birch算法,因此本文选择k-means作为聚类算法对学生答案进行聚类。图4.3聚类方法的比较2)聚类簇数的选择由图4.4可知,k-means算法在数据集CRCC1、CRCC2、CRCC3上的聚类簇数K分别为6、12、3时,轮廓系数值较高,表明聚类效果较好。图4.4不同聚类簇数下的聚类效果4.4.2自动评分实验聚类之后,对每个簇进行代表性答案选择,构建参考答案集。表4.2为CRCC1数据集对应的参考答案集。学生答案①从历史背景角度介绍,②从人物性格方面介

【参考文献】:
期刊论文
[1]基于带注意力机制CNN的联合知识表示模型[J]. 彭敏,姚亚兰,谢倩倩,高望.  中文信息学报. 2019(02)
[2]智慧教育研究现状与发展趋势[J]. 郑庆华,董博,钱步月,田锋,魏笔凡,张未展,刘均.  计算机研究与发展. 2019(01)
[3]几个英语作文自动评分系统的原理与评述[J]. 韩宁.  中国考试(研究版). 2009(03)

硕士论文
[1]高考历史简答题自动评价方法研究[D]. 杨靖云.哈尔滨工业大学 2016



本文编号:3121517

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3121517.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b5f05***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com