基于集成学习的学习者反应矩阵补全方法研究
本文选题:教育数据挖掘 + 智能学习 ; 参考:《华中师范大学》2017年硕士论文
【摘要】:教育数据挖掘是计算机科学、教育学和心理学的交叉性研究课题。它通过分析学习者在智能学习系统中的反馈数据,了解学习者掌握知识的情况和学习内容包含知识点的情况。在国家提出的互联网+教育大数据的基础上,教育数据挖掘将会在信息化建设中发挥更加重要的作用,实现互联网教育因材施教的目标。然而,在实际应用中,反馈数据经常会出现学习者反馈不足的情况。本论文主要研究学习者反馈矩阵补全的问题,这个问题具有深刻的理论意义和实际应用前景,一方面学生反应矩阵是天然的低秩矩阵,对其进行研究有利于进一步加强低秩矩阵恢复理论的理解和深入,另一反面反应矩阵补全对于个性化教学也具有非常实际的意义。本论文的工作大致可以分为两部分。第一部分用基于集成学习的方法改进经典的矩阵补全方法,在集成学习的Bagging和AdaBoost基础上构建了新颖的矩阵补全算法,即BaggingMC和AdaBoostMC算法;第二部分结合两者的优缺点提出了 Improved AdaBoostMC算法,解决了 BaggingMC因简单的投票使矩阵补全的误差仍然较高和AdaBoostMC中阈值随机选取对资源造成的浪费这两个问题。论文在模拟数据和真实数据上分别进行了实验,通过分析矩阵补全在不同数据集上的误差分布来判断不同算法的准确率和补全效果。实验结果表明,BaggingMC与三种经典的矩阵补全算法在补全误差上很接近,AdaBoostMC的误差相对要小,Improved AdaBoostMC在相同数据集和相同采集率的条件下误差最小。同时通过二值Lena图可以直观地看到在同一个数据集中,采集率越高的图片通过矩阵补全恢复后的效果越好。
[Abstract]:Educational data mining is an intersecting research subject of computer science, pedagogy and psychology. By analyzing the feedback data of the learners in the intelligent learning system, it can understand the situation of the learners' mastery of knowledge and the situation that the learning content contains the knowledge points. On the basis of the big data of Internet education put forward by our country, educational data mining will play a more important role in the construction of information technology, and realize the goal of teaching Internet education according to its aptitude. However, in practical application, the feedback data often appear the situation that the learner feedback is insufficient. This paper focuses on the problem of the complement of the learner feedback matrix, which has profound theoretical significance and practical application prospect. On the one hand, the student response matrix is a natural low rank matrix. The research on it is beneficial to the further understanding and deepening of the theory of low rank matrix recovery, and the complement of another reverse reaction matrix is also of great practical significance for individualized teaching. The work of this paper can be divided into two parts. In the first part, the classical matrix complement method is improved based on integrated learning, and a novel matrix complement algorithm, BaggingMC and AdaBoostMC, is constructed on the basis of Bagging and AdaBoost. In the second part, combining the advantages and disadvantages of the two algorithms, the Improved AdaBoostMC algorithm is proposed, which solves the two problems that the error of matrix complement caused by BaggingMC is still high because of simple voting and the waste of resources caused by random selection of threshold in AdaBoostMC. In this paper, experiments are carried out on the simulated data and the real data respectively. By analyzing the error distribution of matrix complement on different data sets, the accuracy and complement effect of different algorithms are judged. The experimental results show that the errors of BaggingMC and three classical matrix complement algorithms are very close to that of Ada boost MC and the error of improved AdaBoostMC is the smallest under the same data set and the same acquisition rate. At the same time, it can be seen intuitively by binary Lena diagram that in the same data set, the higher the collection rate is, the better the effect is after the restoration through matrix complement.
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:G434;TP311.13
【相似文献】
相关期刊论文 前5条
1 陈凯;;基于聚类技术的集成学习差异性研究[J];南京工业职业技术学院学报;2008年04期
2 蔡铁;伍星;;采用离散化处理的选择性SVM集成学习算法[J];深圳信息职业技术学院学报;2010年02期
3 陈凯;;基于GASEN技术的选择性BagBoosting Trees集成学习研究[J];统计教育;2008年12期
4 夏群;;建构美好情景,追寻理想教学[J];新课程(上);2014年01期
5 王道林,张振福,韩明俊;数量化理论Ⅲ的推广[J];泰安师专学报;1999年03期
相关会议论文 前4条
1 关菁华;刘大有;贾海洋;;自适应多分类器集成学习算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 李烨;蔡云泽;许晓鸣;;基于支持向量机集成的故障诊断[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
相关博士学位论文 前10条
1 阿里木·赛买提(Alim.Samat);基于集成学习的全极化SAR图像分类研究[D];南京大学;2015年
2 王永明;集成回归问题若干关键技术研究[D];华东师范大学;2015年
3 常征;基于混合集成学习的眼部与四肢交互动作建模与识别[D];北京科技大学;2016年
4 张春霞;集成学习中有关算法的研究[D];西安交通大学;2010年
5 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
6 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年
7 王清;集成学习中若干关键问题的研究[D];复旦大学;2011年
8 方育柯;集成学习理论研究及其在个性化推荐中的应用[D];电子科技大学;2011年
9 侯勇;特征提取与集成学习算法的研究及应用[D];北京科技大学;2015年
10 李烨;基于支持向量机的集成学习研究[D];上海交通大学;2007年
相关硕士学位论文 前10条
1 高伟;基于半监督集成学习的情感分类方法研究[D];苏州大学;2015年
2 宋文展;基于抽样的集成进化算法研究[D];广西大学;2015年
3 汤莹;迁移与集成学习在文本分类中的应用研究[D];江苏科技大学;2015年
4 刘政;基于知识元和集成学习的中文微博情感分析[D];大连理工大学;2015年
5 丘桥云;结合文本倾向性分析的股评可信度计算研究[D];哈尔滨工业大学;2014年
6 秦海;融合非标记样本选择的集成学习研究[D];湘潭大学;2015年
7 李想;基于多示例的集成学习理论与应用研究[D];合肥工业大学;2014年
8 李震宇;基于集成学习的数字图像隐写定量分析[D];解放军信息工程大学;2014年
9 王希玲;基于选择性集成学习的网络入侵检测方法研究[D];青岛科技大学;2016年
10 陈范曙;基于信息整合的药物相关信息挖掘方法研究[D];华东师范大学;2016年
,本文编号:1933058
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1933058.html