基于数据挖掘的高校学生行为分析方法与应用研究
发布时间:2022-10-23 18:50
随着大数据与人工智能等新技术的发展,将大数据挖掘技术与教育行业相结合以提高学校智慧管理水平的方法日益受到关注与重视。目前,各大高校校园建设已经从数字化校园建设时代步入智慧校园建设时代。高校开始逐步地对已建设的校园一卡通系统、教务系统等校园应用系统进行整合,并对所采集的各大应用系统的历史数据进行挖掘分析,从中提取隐藏的数据价值,以进一步提升学校的服务管理水平。基于此背景,本文以来自各大应用系统的校园一卡通消费记录、图书借阅记录和学生成绩为数据基础,利用数据挖掘和大数据技术对其展开应用分析研究,相关研究工作涵盖以下几个方面:(1)学生消费行为的聚类分析。首先对所构建的学生行为画像特征库中的月均消费金额、月均金额次数、消费强度、消费频率等聚类特征进行统计分析,初步了解学生消费能力水平以及消费行为规律。然后利用基于Spark的分布式K-means++算法对消费行为特征进行聚类分析,将学生人群聚为三类,并对聚类结果的三类人群进行特征对比分析。实验结果表明利用消费强度和消费频率等聚类特征值来辅助学校资助部门进行开展精准扶贫工作是可行的;同时也为发现“隐性贫困生”,找出“假贫困生”提供了一种解决方案...
【文章页数】:88 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 论文选题背景与意义
1.1.1 论文选题背景
1.1.2 课题研究意义
1.2 国内外研究现状
1.3 论文组织及结构
1.4 本章小结
第2章 相关理论与技术基础
2.1 数据挖掘概述
2.1.1 数据挖掘简介
2.1.2 数据挖掘过程
2.1.3 数据挖掘任务
2.2 学生行为分析关键算法
2.2.1 聚类算法
2.2.2 关联规则算法
2.2.3 网络表示学习算法
2.2.4 深度学习算法
2.3 Spark大数据挖掘平台
2.3.1 Spark简介
2.3.2 Spark生态系统
2.3.3 HDFS分布式文件系统
2.3.4 Spark Core
2.3.5 Spark SQL
2.3.6 Spark ML
2.4 本章小结
第3章 学生行为数据预处理与学生行为画像特征库构建
3.1 数据采集
3.2 数据预处理
3.2.1 数据清理
3.2.2 数据集成
3.2.3 数据变换
3.2.4 数据归约
3.3 构建学生行为画像特征库
3.4 本章小节
第4章 基于机器学习的学生行为分析研究
4.1 学生消费行为聚类分析研究
4.1.1 分布式K-means++算法
4.1.2 基于分布式K-means++算法的消费行为聚类模型构建
4.1.3 学生消费行为聚类指标统计分析
4.1.4 聚类结果分析
4.2 学生行为相关性与关联规则挖掘分析研究
4.2.1 相关系数
4.2.2 分布式FP-Growth关联规则
4.2.3 学生行为相关性分析
4.2.4 关联规则数据预处理
4.2.5 学生行为关联规则挖掘分析
4.3 学生社交关系分析研究
4.3.1 基于一阶亲密度的LINE算法
4.3.2 基于二阶亲密度的LINE算法
4.3.3 基于LINE算法的学生社交网络构建
4.3.4 学生社交关系结果分析
4.4 就餐人数预测
4.4.1 LSTM算法
4.4.2 基于LSTM的就餐人数预测模型构建
4.4.3 实验结果分析
4.5 本章小节
第5章 基于Spark的学生行为挖掘分析平台的实现
5.1 Spark大数据挖掘平台架构
5.2 系统整体流程
5.3 Spark大数据挖掘平台搭建
5.3.1 实验环境
5.3.2 平台搭建
5.4 基于Spark的学生行为挖掘分析平台功能实现
5.5 本章小节
第6章 总结与展望
6.1 论文总结
6.2 工作展望
参考文献
指导教师对研究生学位论文的学术评语
学位论文答辩委员会决议书
致谢
攻读硕士学位期间的研究成果
【参考文献】:
期刊论文
[1]基于“松耦合”的职业院校智能化校园建设模式——以兰州石化职业技术学院信息化建设为例[J]. 李延明. 世界教育信息. 2019(23)
[2]基于校园一卡通数据系统的学生行为分析研究[J]. 杜长冲. 读与写(教育教学刊). 2019(06)
[3]基于网络表示学习的科研合作推荐研究[J]. 余传明,林奥琛,钟韵辞,安璐. 情报学报. 2019(05)
[4]基于深度学习的车流量预测方法研究[J]. 史亚星. 计算机与数字工程. 2019(05)
[5]网络表示学习的研究与发展[J]. 尹赢,吉立新,黄瑞阳,杜立新. 网络与信息安全学报. 2019(02)
[6]基于大数据的智慧校园学生综合测评系统[J]. 范振东,陈晖,王海涛,胡强,何柳. 电信快报. 2018(11)
[7]高校贫困生精准资助的神经网络模型[J]. 柴政,屈莉莉,彭贵宾. 数学的实践与认识. 2018(16)
[8]智慧教育2.0:教育信息化2.0视域下的教育新生态——《教育信息化2.0行动计划》解读之二[J]. 郑旭东. 远程教育杂志. 2018(04)
[9]基于学生行为分析模型的高校智慧校园教育大数据应用研究[J]. 李有增,曾浩. 中国电化教育. 2018(07)
[10]基于校园数据的大学生行为画像研究与分析[J]. 董潇潇,胡延,陈彦萍. 计算机与数字工程. 2018(06)
博士论文
[1]基于网络嵌入的社区发现算法研究[D]. 刘起东.兰州大学 2018
硕士论文
[1]面向短时交通流分析与预测的循环神经网络算法研究[D]. 赵庆.西安理工大学 2019
[2]基于集成LSTM的短时车流量预测模型研究[D]. 雷晓.重庆邮电大学 2019
[3]基于深度网络的MOOC辍学预测算法研究[D]. 吴楠楠.西北大学 2019
[4]基于Django框架的Web在线教育平台的设计与实现[D]. 白相辰.北京交通大学 2019
[5]基于数据挖掘技术的高校优质生源基地评选方法研究[D]. 张妍.浙江师范大学 2019
[6]基于数据挖掘技术的高校智慧宿舍系统的研究与实现[D]. 张祯巍.华中师范大学 2019
[7]用户画像构建技术研究与可视化应用[D]. 刘彤.大连理工大学 2019
[8]基于一卡通数据的学生校园消费活动规律研究[D]. 任晋华.华中师范大学 2018
[9]基于校园大数据的数据挖掘研究[D]. 谭浩.山东理工大学 2018
[10]针对社交网络表示学习的图采样设计[D]. 马曼青.吉林大学 2018
本文编号:3696937
【文章页数】:88 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 论文选题背景与意义
1.1.1 论文选题背景
1.1.2 课题研究意义
1.2 国内外研究现状
1.3 论文组织及结构
1.4 本章小结
第2章 相关理论与技术基础
2.1 数据挖掘概述
2.1.1 数据挖掘简介
2.1.2 数据挖掘过程
2.1.3 数据挖掘任务
2.2 学生行为分析关键算法
2.2.1 聚类算法
2.2.2 关联规则算法
2.2.3 网络表示学习算法
2.2.4 深度学习算法
2.3 Spark大数据挖掘平台
2.3.1 Spark简介
2.3.2 Spark生态系统
2.3.3 HDFS分布式文件系统
2.3.4 Spark Core
2.3.5 Spark SQL
2.3.6 Spark ML
2.4 本章小结
第3章 学生行为数据预处理与学生行为画像特征库构建
3.1 数据采集
3.2 数据预处理
3.2.1 数据清理
3.2.2 数据集成
3.2.3 数据变换
3.2.4 数据归约
3.3 构建学生行为画像特征库
3.4 本章小节
第4章 基于机器学习的学生行为分析研究
4.1 学生消费行为聚类分析研究
4.1.1 分布式K-means++算法
4.1.2 基于分布式K-means++算法的消费行为聚类模型构建
4.1.3 学生消费行为聚类指标统计分析
4.1.4 聚类结果分析
4.2 学生行为相关性与关联规则挖掘分析研究
4.2.1 相关系数
4.2.2 分布式FP-Growth关联规则
4.2.3 学生行为相关性分析
4.2.4 关联规则数据预处理
4.2.5 学生行为关联规则挖掘分析
4.3 学生社交关系分析研究
4.3.1 基于一阶亲密度的LINE算法
4.3.2 基于二阶亲密度的LINE算法
4.3.3 基于LINE算法的学生社交网络构建
4.3.4 学生社交关系结果分析
4.4 就餐人数预测
4.4.1 LSTM算法
4.4.2 基于LSTM的就餐人数预测模型构建
4.4.3 实验结果分析
4.5 本章小节
第5章 基于Spark的学生行为挖掘分析平台的实现
5.1 Spark大数据挖掘平台架构
5.2 系统整体流程
5.3 Spark大数据挖掘平台搭建
5.3.1 实验环境
5.3.2 平台搭建
5.4 基于Spark的学生行为挖掘分析平台功能实现
5.5 本章小节
第6章 总结与展望
6.1 论文总结
6.2 工作展望
参考文献
指导教师对研究生学位论文的学术评语
学位论文答辩委员会决议书
致谢
攻读硕士学位期间的研究成果
【参考文献】:
期刊论文
[1]基于“松耦合”的职业院校智能化校园建设模式——以兰州石化职业技术学院信息化建设为例[J]. 李延明. 世界教育信息. 2019(23)
[2]基于校园一卡通数据系统的学生行为分析研究[J]. 杜长冲. 读与写(教育教学刊). 2019(06)
[3]基于网络表示学习的科研合作推荐研究[J]. 余传明,林奥琛,钟韵辞,安璐. 情报学报. 2019(05)
[4]基于深度学习的车流量预测方法研究[J]. 史亚星. 计算机与数字工程. 2019(05)
[5]网络表示学习的研究与发展[J]. 尹赢,吉立新,黄瑞阳,杜立新. 网络与信息安全学报. 2019(02)
[6]基于大数据的智慧校园学生综合测评系统[J]. 范振东,陈晖,王海涛,胡强,何柳. 电信快报. 2018(11)
[7]高校贫困生精准资助的神经网络模型[J]. 柴政,屈莉莉,彭贵宾. 数学的实践与认识. 2018(16)
[8]智慧教育2.0:教育信息化2.0视域下的教育新生态——《教育信息化2.0行动计划》解读之二[J]. 郑旭东. 远程教育杂志. 2018(04)
[9]基于学生行为分析模型的高校智慧校园教育大数据应用研究[J]. 李有增,曾浩. 中国电化教育. 2018(07)
[10]基于校园数据的大学生行为画像研究与分析[J]. 董潇潇,胡延,陈彦萍. 计算机与数字工程. 2018(06)
博士论文
[1]基于网络嵌入的社区发现算法研究[D]. 刘起东.兰州大学 2018
硕士论文
[1]面向短时交通流分析与预测的循环神经网络算法研究[D]. 赵庆.西安理工大学 2019
[2]基于集成LSTM的短时车流量预测模型研究[D]. 雷晓.重庆邮电大学 2019
[3]基于深度网络的MOOC辍学预测算法研究[D]. 吴楠楠.西北大学 2019
[4]基于Django框架的Web在线教育平台的设计与实现[D]. 白相辰.北京交通大学 2019
[5]基于数据挖掘技术的高校优质生源基地评选方法研究[D]. 张妍.浙江师范大学 2019
[6]基于数据挖掘技术的高校智慧宿舍系统的研究与实现[D]. 张祯巍.华中师范大学 2019
[7]用户画像构建技术研究与可视化应用[D]. 刘彤.大连理工大学 2019
[8]基于一卡通数据的学生校园消费活动规律研究[D]. 任晋华.华中师范大学 2018
[9]基于校园大数据的数据挖掘研究[D]. 谭浩.山东理工大学 2018
[10]针对社交网络表示学习的图采样设计[D]. 马曼青.吉林大学 2018
本文编号:3696937
本文链接:https://www.wllwen.com/jiaoyulunwen/gaodengjiaoyulunwen/3696937.html