基于网络日志的高校学生成绩预测系统的研究与实现
本文关键词:基于网络日志的高校学生成绩预测系统的研究与实现,由笔耕文化传播整理发布。
【摘要】:教育数据挖掘(Educational Data Mining,简称EDM)技术是一个涉及到计算机技术、教育学和统计学等多学科的交叉研究领域,是数据挖掘技术在教育领域的扩展和应用。如今,伴随着互联网和信息技术在教育环境中的快速普及,教育相关数据的收集变得越来越高效,EDM研究也越来越受到教育研究者的重视。学生成绩预测是最早也是最流行的EDM应用之一,具有较高的实用价值和一定的学术研究意义。现有的关于成绩预测研究的数据大多来自于专门的数字化教学软件和智能教学系统等,研究成果具有较强的针对性,但仅适用于分析特定系统,缺乏通用性。为了能够得出较为普遍的成绩预测模型,本文使用学生的日常上网数据预测学生学术表现。通过研究证实,使用学生日常上网数据可以对学生《数据结构》课程的成绩进行预测,有一定的实际应用价值。本文所做工作主要包括以下几部分内容:1、分析当前有关EDM研究的研究现状,介绍课题的研究背景和主要研究内容。在研究开始之前,本文对相关的基础知识进行讲解,如数据挖掘的定义与原理等背景知识、EDM研究特点与EDM在国内外的教育实践、机器学习的定义、朴素贝叶斯分类法和逻辑回归分类法的基本原理等。2、对学生上网记录的原始数据集进行了预处理。对研究所用到的数据进行了介绍,包括对数据来源、数据格式和数据特点等的介绍。在EDM建立模型之前,数据预处理工作是最重要的环节之一,该阶段的质量对整个EDM项目的成果好坏起到关键的作用,本文将详细介绍数据预处理的过程。3、提出使用学生日常上网日志数据预测学生学术表现的方法。通过实验,使用朴素贝叶斯分类法和逻辑回归分类算法在六种不同数据集上建立预测模型预测学生《数据结构》课程成绩是否合格,对预测结果进行评估和对比,并介绍该方法在实际系统中的应用。4、得出使用学生日常上网数据预测学术表现可行的结论,分析研究中的不足并提出相应的改进方法,展望今后的相关工作。本文证实了学生日常上网行为与学术表现是有一定关联的。使用上网数据可以成功识别出成绩不合格学生中65%以上的学生,同时对成绩合格学生的识别成功率达到88%,研究发现浏览更多在线视频和更少技术类网站的学生更有可能在《数据结构》课程中成绩不合格。研究方法应用到实际系统可以帮助教师及早帮助学业困难的学生,提高学生成绩,有比较好的实用价值。
【关键词】:教育数据挖掘 学术表现 成绩预测 朴素贝叶斯 网络日志
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G642.4;TP311.13
【目录】:
- 中文摘要3-4
- 英文摘要4-8
- 1 绪论8-12
- 1.1 课题研究背景8
- 1.2 教育数据挖掘研究现状8-10
- 1.3 本文研究的主要内容10-11
- 1.4 本文的工作及论文结构11-12
- 2 教育数据挖掘概述12-18
- 2.1 数据挖掘技术的原理及基本步骤12-14
- 2.1.1 数据挖掘的定义及原理12-13
- 2.1.2 数据挖掘的基本步骤13-14
- 2.2 教育数据挖掘的特点14-17
- 2.2.1 教育数据挖掘的过程16
- 2.2.2 教育数据挖掘在国内外的教育实践16-17
- 2.3 本章小结17-18
- 3 机器学习算法18-25
- 3.1 贝叶斯分类器19-21
- 3.1.1 贝叶斯定理19
- 3.1.2 朴素贝叶斯分类法19-21
- 3.2 逻辑回归算法21-23
- 3.2.1 逻辑回归模型21-22
- 3.2.2 基于最优化方法的最佳回归系数确定22-23
- 3.3 本章小结23-25
- 4 数据集及数据预处理25-40
- 4.1 数据来源25-26
- 4.1.1 网络日志25-26
- 4.1.2 学生成绩数据26
- 4.2 数据预处理26-34
- 4.2.1 网址分类与频次统计27-30
- 4.2.2 视频时间统计30-33
- 4.2.3 成绩处理33-34
- 4.3 特征选取34-39
- 4.3.1 上网频次特征的选取37
- 4.3.2 视频时间与成绩特征37-38
- 4.3.3 数据的正态转换38-39
- 4.4 本章小结39-40
- 5 一个基于数据挖掘的成绩预测模型的构建与软件实现40-57
- 5.1 特征组合40
- 5.2 交叉验证40-41
- 5.3 模型评估41-44
- 5.3.1 逻辑回归预测结果42-43
- 5.3.2 朴素贝叶斯分类器预测表现43
- 5.3.3 模型对比与评估43-44
- 5.4 软件实现44-56
- 5.4.1 系统概述44
- 5.4.2 系统功能模块的设计44-45
- 5.4.3 系统运行环境45-46
- 5.4.4 系统设计46-48
- 5.4.5 系统数据库表结构的设计48-52
- 5.4.6 网络日志分析系统主要界面设计52-54
- 5.4.7 成绩预测系统主要界面设计54-56
- 5.5 本章小结56-57
- 6 总结与展望57-58
- 6.1 本文工作总结57
- 6.2 后续的工作及展望57-58
- 致谢58-59
- 参考文献59-63
- 附录 作者在攻读硕士学位期间发表的论文目录63
【相似文献】
中国期刊全文数据库 前10条
1 香丽芸;浅谈数据挖掘及其应用[J];昌吉师专学报;2001年02期
2 韩海萌;信息时代的指南针——数据挖掘[J];江苏统计;2002年05期
3 林阳;数据挖掘在教育信息化中的潜在价值[J];现代教育技术;2002年01期
4 朱世武 ,崔嵬 ,张尧庭 ,谢邦昌;数据挖掘运用的理论与技术[J];统计研究;2003年08期
5 王晓涓,祁慧敏;数据挖掘漫谈[J];天中学刊;2003年02期
6 韩江;数据挖掘——极具发展潜力的新领域[J];苏州市职业大学学报;2004年01期
7 李菁菁,邵培基,黄亦潇;数据挖掘在中国的现状和发展研究[J];管理工程学报;2004年03期
8 ;中国科学院数据挖掘与知识管理学术研讨会在京举行[J];管理评论;2004年07期
9 魏瑜,陆静;数据挖掘与统计学的关系浅析[J];沿海企业与科技;2005年09期
10 单靖华;金矿就在你手中 读《数据挖掘——客户关系管理的科学与艺术》随笔[J];数据;2005年10期
中国重要会议论文全文数据库 前10条
1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
中国博士学位论文全文数据库 前10条
1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年
2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年
3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年
4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年
5 邬文帅;基于多目标决策的数据挖掘方法评估与应用[D];电子科技大学;2015年
6 谢邦彦;整合数据挖掘与TRIZ理论的质量管理方法研究[D];首都经济贸易大学;2010年
7 何伟全;云南高校学生意外伤害因素关联规则挖掘及风险管控体系研究[D];昆明理工大学;2015年
8 段功豪;基于多结构数据挖掘的滑坡灾害预测模型研究[D];中国地质大学;2016年
9 白晓明;基于数据挖掘的复合材料宏—细观力学模型研究[D];哈尔滨工业大学;2016年
10 蓝永豪(LAM Wing Ho);基于数据挖掘技术分析当代中医名家痤疮验方经验研究[D];南京中医药大学;2016年
中国硕士学位论文全文数据库 前10条
1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年
2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年
3 焦亚召;基于多核函数FCM算法在数据挖掘聚类中的应用研究[D];昆明理工大学;2015年
4 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年
5 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年
6 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年
7 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年
8 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年
9 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年
10 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年
本文关键词:基于网络日志的高校学生成绩预测系统的研究与实现,由笔耕文化传播整理发布。
,本文编号:298371
本文链接:https://www.wllwen.com/jiaoyulunwen/gaodengjiaoyulunwen/298371.html