当前位置:主页 > 科技论文 > 自动化论文 >

基于机器学习的试题多知识点和认知动词自动标注研究

发布时间:2023-06-02 20:44
  在互联网教育时代,教育信息化为教育领域带来了重大变革,很多教学资源都以数据的形式存储。其中尤为重要的是试题数据资源。而现在普遍存在的情况是,这些试题数据在设计时仅仅包含试题的内容和答案,并没有直接给出试题所考察的目标,即缺少认知动词和知识点的标注。因此,如何能自动地为试题标注所考察的知识点和要求的认知动词层级,更好地发挥试题数据资源的作用是一项十分有意义的研究内容。基于此,针对数学试题数据本文的研究任务主要分为两部分,分别是基于机器学习的知识点标注和认知动词标注。(1)提出了一种基于集成学习的多知识点标注方法。在试题知识点标注方面,首先对试题知识点标注问题进行了形式化的定义,将试题多知识点标注问题转化为多标签分类问题;借助教材目录和领域知识构建知识点的知识图谱,并以此作为试题的知识点标签体系,并用知识图谱对原始的试题知识点数据进行了替换;构建了以支持向量机为基分类器的集成学习多知识点标注方法,通过设置子集准确率阈值来筛选出优基分类器进行集成,以期达到更好的标注效果。(2)提出了一种基于数据增强的数学试题认知动词标注方法。首先,使用不同认知动词下的试题文本数据分别构建深度文本生成模型,用...

【文章页数】:62 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景与意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 研究内容和论文结构
2 相关理论概述
    2.1 试题资源的知识点标注和认知动词标注
        2.1.1 试题知识点标注
        2.1.2 知识点标注国内外研究现状
        2.1.3 试题认知动词标注
        2.1.4 认知动词标注国内外研究现状
    2.2 文本分类
        2.1.1 一般文本分类过程
        2.1.2 短文本分类
    2.3 机器学习相关概念概述
        2.3.1 监督学习
        2.3.2 集成学习
        2.3.3 数据不平衡问题
    2.4 深度学习相关概念概述
        2.4.1 卷积神经网络
        2.4.2 循环神经网络
        2.4.3 深度文本生成
3 基于集成学习的试题多知识点标注方法
    3.1 试题知识点标注问题
        3.1.1 问题描述
        3.1.2 问题形式化定义
    3.2 标注流程与标注方法
        3.2.1 试题题干处理
        3.2.2 知识点的知识图谱构建
        3.2.3 基分类器的构建与集成
    3.3 数值实验
        3.3.1 实验数据集及评价指标
        3.3.2 实验过程及结果分析
    3.4 小结
4 基于数据增强的试题认知动词标注方法
    4.1 认知动词标注问题
        4.1.1 问题描述
        4.1.2 问题形式化定义
    4.2 标注流程与标注方法
        4.2.1 原始数据预处理
        4.2.2 基于文本生成的试题数据增强方法
        4.2.3 基于多层次不确定性抽样的试题数据筛选方法
    4.3 深度学习文本分类方法TextCNN
    4.4 数值实验
        4.4.1 实验数据构建
        4.4.2 实验评价指标
        4.4.3 实验设置
        4.4.4 实验过程及结果分析
    4.5 小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
攻读硕士学位期间参加科研项目情况
致谢



本文编号:3828007

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3828007.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户782ef***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com