基于专家知识的可解释作文评级方法

发布时间:2024-12-19 06:38
  在语文教育中,作文能力是评价学生语言水平的重要指标。自动作文评分不仅能够在考试测评领域对人工评阅的客观性和公正性提供技术支撑,而且能够辅助提升个人作文能力,具有重要的理论价值和应用价值。自动作文评分仍面临许多挑战。首先,虽然不同专家根据要求能够对作文评判一致,但是目前仍缺乏可量化的作文评分规则。其次,语言作为一种符号化体系,具有更高的灵活性,自然语言的处理相较于结构化数据的处理更为困难,过程缺乏可解释性。最后,考虑到语料库的标注问题,现存的大部分作文评分工作专注于对作文给出一个整体得分,缺少对作文细粒度评分的标注。词汇是作文的基础组成部分和重要评分依据,从词汇角度量化作文水平并融入到模型中是十分有必要的。针对上述问题,本文从词汇语用方面入手,提出了基于专家知识的可解释作文评级方法。本文贡献如下:(1)提出了基于专家评阅规范的中文作文词汇可量化评估框架,对语料库作文词汇水平进行标注。为了从词汇这一角度提升模型的可解释性,本文研究了高考作文评分标准和多个分等级词汇库,分析了初等教育小学和中学作文语料库,形成了基于专家知识和统计分析的分级词汇表。在此基础上,分析了在语言认知过程中作文词汇水平的...

【文章页数】:65 页

【学位级别】:硕士

【部分图文】:

图3-1全部年级和三年级各评级作文数量??

图3-1全部年级和三年级各评级作文数量??

优”、“良”、“中”、“差”四个等级,数据基本情况如表??3-3。??表3-3中小学作文语料库基本情况??小学?初中?高中??年级?1?2?3?4?5?6?7?8?9?10?11?12??作文数?4230?12188?20743?27360?22549?29307?18569?1....


图3-2各年级的词汇使用情况??结合以上统计分析,我们认为学生作文词汇水平提升的过程,同时也是语言??

图3-2各年级的词汇使用情况??结合以上统计分析,我们认为学生作文词汇水平提升的过程,同时也是语言??

?山东大学硕士学位论文???本文使用分级词汇表对作文所使用的词汇进行分级,考察作文在各个等级??词汇上的使用情况。使用《汉语水平词汇与汉字等级大纲》对各年级的词汇使用??情况进行统计,结果如图3-2,横坐标表示年级,纵坐标表示该等级词汇的使用??数量。我们假设随着学生年级的提升,....


图3-3不同词汇表对应关系图??最后,本文将收集到的成语库中的成语以及高级动词库中的高级动词作为4??

图3-3不同词汇表对应关系图??最后,本文将收集到的成语库中的成语以及高级动词库中的高级动词作为4??

汇表中的1级词汇,3、4级词汇对应于新词汇表中的2级词汇,5、6级词汇对??应于新词汇表中的3级词汇,对应关系如图3-3。??对于各分级词汇表中不一致的词语,我们保留《大纲》中的分级。例如,“游??览”一词在《大纲》中为乙级词汇,但是在《新HSK词汇表》中为5级词汇,按??照上述....


图3M全部年级词汇使用统计??同时,通过分析上图我们可以发现,同一年级学生对于词汇的使用仍然存在??

图3M全部年级词汇使用统计??同时,通过分析上图我们可以发现,同一年级学生对于词汇的使用仍然存在??

?山东大学硕士学位论文???的图(如图3 ̄4-a和图3-5-a)可以看出,在对同一级别词汇的使用情况上,全体??分布和每个年级的分布类似。??由图3-5,不同年级作文使用同一级别词汇的分布均值是不同的,且随着年??级的增高,均值不断増加,分布逐渐右移,学生对于词汇的使用数量也逐步....



本文编号:4017816

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/4017816.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1c995***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com