当前位置:主页 > 教育论文 > 教育心理论文 >

教育数据挖掘中分类问题的可解释性研究

发布时间:2021-07-31 22:59
  教育数据挖掘(EDM,Educational Data Mining)运用机器学习等技术来解决教育研究与实践中的问题,涉及计算机科学、教育学和心理学等多门学科。由于EDM的研究成果主要服务于广大师生及教育决策者,它对机器学习模型的可解释性有较高的要求。一方面,EDM的用户一般不是信息技术专业人员,如果模型难于理解,他们可能拒绝使用该模型;另一方面,教育决策者通常要为自己的决策行为负责,如果模型不能给出合理的依据,他们可能不愿使用该模型来辅助决策。在过去几十年中,机器学习模型的可解释性问题一直备受关注,并取得了一些成果,但仍然存在一些问题,例如缺乏对不同模型可解释性的统一度量标准、较少考虑人的认知因素等。而EDM乃至整个数据挖掘领域的可解释性研究也存在诸多不足,特别地,当前研究主要集中于模型建立阶段的可解释性问题,忽略了数据挖掘生命周期中其他阶段的可解释性研究。针对以上问题,本文进行了充分的研究,提出了一个涉及数据挖掘整个生命周期的可解释性研究方案。鉴于分类模型在EDM乃至数据挖掘领域中应用最为广泛,本文只涉及EDM中的分类问题,主要工作包括以下五个方面:(1)系统地研究了数据挖掘中的可... 

【文章来源】:重庆大学重庆市 211工程院校 985工程院校 教育部直属院校

【文章页数】:168 页

【学位级别】:博士

【文章目录】:
中文摘要
英文摘要
1 绪论
    1.1 研究背景和意义
        1.1.1 本文的研究背景
        1.1.2 本文的研究意义
    1.2 国内外研究进展
        1.2.1 机器学习模型的可解释性
        1.2.2 EDM中的可解释性研究
        1.2.3 当前研究存在的问题
    1.3 论文主要研究内容及创新点
        1.3.1 本文主要研究的内容
        1.3.2 本文的工作和创新点
    1.4 论文组织结构
2 论文相关的基础知识介绍
    2.1 引言
    2.2 论文所依托的应用背景
        2.2.1 互联网行为预测学生表现
        2.2.2 就业层次预测
    2.3 EDM中常见数据挖掘技术及其可解释性
        2.3.1 常见数据挖掘技术
        2.3.2 模型的可解释性
    2.4 预测模型的评估标准
    2.5 论文中所涉及数据集的介绍
        2.5.1 教育数据集
        2.5.2 其他数据集
    2.6 本章小结
3 一个理解原始数据集的处理流程
    3.1 引言
    3.2 ⅡOD-DU流程
        3.2.1 流程概述
        3.2.2 两种特征选择方法
    3.3 实验结果与分析
        3.3.1 数据集
        3.3.2 理解问题的难度
        3.3.3 理解类标
        3.3.4 理解特征
    3.4 本章小结
4 一种两阶段的数据准备方法
    4.1 引言
    4.2 TSDP方法
        4.2.1 方法概述
        4.2.2 Ⅰ阶段的分析
        4.2.3 Ⅱ阶段的分析
    4.3 两种事后解释方法
    4.4实验
        4.4.1 实验一:验证TSDP方法的有效性
        4.4.2 实验二:使用事后解释法理解特征
    4.5 本章小结
5 一种解释SVM分类模型的方法
    5.1 引言
    5.2 认知心理学相关理论知识简介
        5.2.1 信息加工理论
        5.2.2 范例理论
        5.2.3 可得性启发式
        5.2.4 透镜模型
    5.3 研究框架
    5.4 ISVM方法
        5.4.1 范例选择算法
        5.4.2 事后解释算法
    5.5 实验结果与分析
        5.5.1 实验数据
        5.5.2 评估标准
        5.5.3 对比方法
        5.5.4 结果分析
    5.6 本章小结
6 一种跨模型评估可解释性的研究框架及其实现
    6.1 引言
    6.2 EIDM研究框架
    6.3 提取特征
    6.4 测量可解释性
        6.4.1 调查问卷的设计
        6.4.2 调查问卷的实施
    6.5 标注类标
    6.6 构建评判模型
    6.7 实验结果与分析
        6.7.1 验证调查的合理性
        6.7.2 评估判别模型的性能
        6.7.3 实验小结
    6.8 本章小结
7 总结与展望
    7.1 主要结论
    7.2 展望
致谢
参考文献
附录
    A.作者在攻读博士学位期间发表的论文目录
    B.作者在攻读博士学位期间申请的发明专利
    C.作者在攻读博士学位期间参与的科研项目


【参考文献】:
期刊论文
[1]教育数据挖掘研究进展综述[J]. 周庆,牟超,杨丹.  软件学报. 2015(11)
[2]判断与决策中的易得性启发式[J]. 李燕,徐富明,孔诗晓.  心理研究. 2015(05)
[3]大学生上网情况与学业成绩关系的实证研究[J]. 袁晓蕾,李晓东,吉运,王茁.  中国教育信息化. 2015(10)
[4]基于SVM的小样本条件下继电保护可靠性参数估计[J]. 何旭,姜宪国,张沛超,高翔,李仲青.  电网技术. 2015(05)
[5]试论研究生就业竞争力的提升[J]. 耿红,张海防.  江苏高教. 2015(03)
[6]面向在线教育领域的大数据研究及应用[J]. 陈池,王宇鹏,李超,张勇,邢春晓.  计算机研究与发展. 2014(S1)
[7]高校学生评奖评优中马太效应的研究[J]. 毛颖,王丽君.  湖北科技学院学报. 2014(11)
[8]改革后的CET对学生课外英语学习过程的反拨效应实证研究——基于学生的学习日志[J]. 辜向东,张正川,刘晓华.  解放军外国语学院学报. 2014(05)
[9]基于特征子集区分度与支持向量机的特征选择算法[J]. 谢娟英,谢维信.  计算机学报. 2014(08)
[10]基于主题的微博二级好友推荐模型研究[J]. 唐晓波,祝黎,谢力.  图书情报工作. 2014(09)

博士论文
[1]Web评论文本情感分类方法研究[D]. 张璞.重庆大学 2015

硕士论文
[1]基于网络日志的高校学生成绩预测系统的研究与实现[D]. 郑友杰.重庆大学 2016
[2]基于像素的可视化技术及其度量模型的研究[D]. 李勇.北京交通大学 2010



本文编号:3314336

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyuxinli/3314336.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e33f5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com