自动作文评分的关键技术研究
发布时间:2021-02-08 15:49
英语教育越来越受重视,写作是其中的重要一环,自动作文评分可以解决传统人工阅卷的很多问题,比如可以减轻老师的工作量,加快学生写作的反馈,提升考试的公平性等,吸引了许多学者的研究。自动作文评分系统并不能真正理解作文,而是通过构建能反映词语、句子和篇章等各种尺度的特征来间接评估作文分数,因此,挖掘出隐藏在数据中的更深层次特征对提升系统效果有很大的影响。一篇好的文章总是有一个特殊的高层逻辑及主题结构,其中实际的单词和句子选择以及它们之间的排列都是为这个高层结构服务的,因此一篇文章的语句通顺度可以作为自动作文评分的重要指标。作文范文中存在大量词汇、语法和语义信息,通过计算学生答案与范文的文本匹配度,使得对作文的评判多了一种重要的结合结构和语义信息的深层次参考标准。本论文的主要研究内容和创新之处如下:(1)我们提出了一种融合多特征的深度语句通顺度计算算法。针对传统方式词向量表示粗糙,不能发现无关词和句子的问题,我们引入外部知识为训练过程添加先验信息,针对知识库的知识表示学习可以学习到词语的知识信息;词语的同义词表示可以帮助更好地解决一词多义问题;通过将依存关系嵌入结合进来,可以更好地建模文本的语法...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
句法关系标注示意图④
第二章相关基础知识和理论介绍15首先介绍一元回归分析方法,假设自变量为,这些变量认为和因变量y有关联,一元回归分析假设:(2-8)其中为未知的参数向量,e称为随机误差项,一般假设,且。对总体进行随机抽样时,假设有n个样本,每个样本有模型(2-9)表示成矩阵形式后为图2-2:图2-2一元回归方程其中表示对总体变量的独立重复观测。一般假设误差有下述性质:(1);(2);(3)。对于一元回归分析,一般关心的任务有:(1)参数及其函数的估计问题(可估性,最小二乘估计)(2)参数估计量的性质(3)模型诊断方面,包括参数的检验问题(正态分布假设,似然比试验),变量选择问题,残差分析(模型假设的检查,数据清洁)(4)模型的预测功能其中,最小二乘估计的定义是对β的估计方法为使得残差平方和达到最小:(2-10)其中。当X为满秩的时候(p<n),上述最小化残差平方和的β可以得出(2-11)
方式。奇异值分解(Singular Value Decomposition,SVD)是线性代数中的一种技术,可以将任意矩阵 M 分解为三个独立矩阵的乘积:M = U*S*V,其中 S 是矩阵M 奇异值的对角矩阵。为此,对于文档—词语矩阵 A,可以得到一个如下式的矩阵分解: (2-14) 奇异值和特征分解中的特征值类似,在奇异值矩阵中奇异值是按照从大到小排列的,而且奇异值减小地特别快,因此可以用最大的 k 个奇异值和对应的左右奇异向量来近似描述矩阵,即矩阵 A 可以通过图 2-3 等号右侧的三个小矩阵来近似描述:
【参考文献】:
期刊论文
[1]自动作文评分系统对大学生英语写作能力的影响实证研究[J]. 宋毅宁. 大学教育. 2019(10)
[2]基于文采特征的高考作文自动评分[J]. 刘明杨,秦兵,刘挺. 智能计算机与应用. 2016(01)
[3]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
[4]HSK自动作文评分的特征选取研究[J]. 黄志娥,谢佳莉,荀恩东. 计算机工程与应用. 2014(06)
[5]国外作文自动评分系统评述及启示[J]. 梁茂成,文秋芳. 外语电化教学. 2007(05)
[6]使用潜语义分析的汉语作文自动评分研究[J]. 曹亦薇,杨晨. 考试研究. 2007(01)
硕士论文
[1]汉语作为第二语言测试的作文自动评分研究[D]. 李亚男.北京语言大学 2006
本文编号:3024162
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
句法关系标注示意图④
第二章相关基础知识和理论介绍15首先介绍一元回归分析方法,假设自变量为,这些变量认为和因变量y有关联,一元回归分析假设:(2-8)其中为未知的参数向量,e称为随机误差项,一般假设,且。对总体进行随机抽样时,假设有n个样本,每个样本有模型(2-9)表示成矩阵形式后为图2-2:图2-2一元回归方程其中表示对总体变量的独立重复观测。一般假设误差有下述性质:(1);(2);(3)。对于一元回归分析,一般关心的任务有:(1)参数及其函数的估计问题(可估性,最小二乘估计)(2)参数估计量的性质(3)模型诊断方面,包括参数的检验问题(正态分布假设,似然比试验),变量选择问题,残差分析(模型假设的检查,数据清洁)(4)模型的预测功能其中,最小二乘估计的定义是对β的估计方法为使得残差平方和达到最小:(2-10)其中。当X为满秩的时候(p<n),上述最小化残差平方和的β可以得出(2-11)
方式。奇异值分解(Singular Value Decomposition,SVD)是线性代数中的一种技术,可以将任意矩阵 M 分解为三个独立矩阵的乘积:M = U*S*V,其中 S 是矩阵M 奇异值的对角矩阵。为此,对于文档—词语矩阵 A,可以得到一个如下式的矩阵分解: (2-14) 奇异值和特征分解中的特征值类似,在奇异值矩阵中奇异值是按照从大到小排列的,而且奇异值减小地特别快,因此可以用最大的 k 个奇异值和对应的左右奇异向量来近似描述矩阵,即矩阵 A 可以通过图 2-3 等号右侧的三个小矩阵来近似描述:
【参考文献】:
期刊论文
[1]自动作文评分系统对大学生英语写作能力的影响实证研究[J]. 宋毅宁. 大学教育. 2019(10)
[2]基于文采特征的高考作文自动评分[J]. 刘明杨,秦兵,刘挺. 智能计算机与应用. 2016(01)
[3]知识表示学习研究进展[J]. 刘知远,孙茂松,林衍凯,谢若冰. 计算机研究与发展. 2016(02)
[4]HSK自动作文评分的特征选取研究[J]. 黄志娥,谢佳莉,荀恩东. 计算机工程与应用. 2014(06)
[5]国外作文自动评分系统评述及启示[J]. 梁茂成,文秋芳. 外语电化教学. 2007(05)
[6]使用潜语义分析的汉语作文自动评分研究[J]. 曹亦薇,杨晨. 考试研究. 2007(01)
硕士论文
[1]汉语作为第二语言测试的作文自动评分研究[D]. 李亚男.北京语言大学 2006
本文编号:3024162
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3024162.html
最近更新
教材专著