基于校园一卡通系统的数据分析及可视化研究
发布时间:2021-01-07 17:49
随着智慧校园概念的提出,教育数据的挖掘成为了人们研究的一个热点问题。而校园卡应用数据作为最能反映学生校园生活的业务数据,对智慧校园的建设有着至关重要的作用。针对校园卡应用数据的存储和管理、数据挖掘和分析、数据可视化等3个研究问题,本文设计并实现了一个基于校园卡应用数据的分析及可视化系统,用于帮助师生理解数据的隐含规律,为学生的校园生活和管理人员的管理工作提供决策支持。本文首先针对校园卡应用数据的特点,设计了面向主题的数据仓库,将多源的异构数据进行不同层次的聚合,方便了数据查询和分析。其次,本文从数据挖掘和传统统计分析两个角度对校园卡应用数据进行了特定的主题分析。从数据挖掘角度,本文实现了自动化ARIMA模型,并应用于校园热点区域的人流量预测;提出了一种改进的k-means算法,并应用于校园卡用户的消费特征聚类分析;提出了一种基于校园卡应用数据的学生成绩预测模型,提取了 7类能影响学生成绩的特征指标,采用随机森林算法对学生是否具有挂科风险进行预测,并通过实验证明了结果的有效性。从传统统计分析角度,本文对消费分布特征、学生行为相似度、学期账单、热点商户和消费明细查询等主题进行了统计分析。最...
【文章来源】:北京化工大学北京市 211工程院校 教育部直属院校
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
图3-3消费统计OLAP结构??Fig.3-3?Consumption?Statistics?OLAP?Structure??3.2.2?ETL调度系统设计??ETL是构建数据仓库的必要步骤
?第四章基于数据挖掘技术的分析???表4-1时间序列示例??Table?4-1?Time?Series?Example??时段?人流量??2018-10-22?14:00-15:00?10??2018-10-22?15:00-16:00?143??2018-10-22?16:00-17:00?211??2018-10-22?17:00-18:00?206??2018-10-22?18:00-19:00?244??2018-10-22?19:00-20:00?179??2018-10-22?20:00-21:00?229??2018-10-22?21:00-22:00?48??2018-10-23?14:00-15:00?10??2018-10-23?15:00-16:00?106???????????????4.1.4实验结果与分析??(1)对时间序列进行平稳性检验??对原始时间序列数据作图,如图4-2所示。通过观察法可以看出,序列在150??左右上下波动,没有明显的趋势性,基本平稳。但仍需要进行ADF检验,通过自??动化程序判断序列是否平稳。??35〇???raw?time?series???〗:l』y?iiiwii??I”。??100?-?.??5。11⑴j?11?j卩11丨11卜??〇l?i?i?^——.——?i?:???0?20?40?60?80?100?120?140??nobs??图4-2原始真实时间序列数据??Fig.4-2?Raw?time?series?data??29??
?第四章基于数据挖掘技术的分析????raw.?acf?|??raw?pacf??i〇?1?i.〇r—??0.8??0.5?°'6??0.2?—??M^nTF^TTF^TT?」丨二??-?'?■?i?M ̄ ̄|?I?11?n?f?i?*??-0.2?’…??’'…—??—?■??-〇.5?一'm?.??-0.4????0?5?10?15?20?0?5?10?15?20??图4-3自相关和偏自相关函数图??Fig.4-3?Autocorrelation?and?partial?autocorrelation?function?graph??(4)模型验证??对ARMA?(14,2)分别进行残差检验和D-W检验。残差检验,即检验残差序??列是否为白噪声序列检验。因为原始时间序列为非白噪序列,若残差序列为白噪??声序列,则说明原始时间序列中的有用信息己经全部被提取,剩余信息均为随机??扰动,是无法用于预测的。统计量如表4-5所示。延迟阶数分别为6、12、24时,??pvalue值均大于0.05,说明残差序列为白噪声序列。一般,当延迟阶数为1-12且??pvalue值均大于0.05时,序列为白噪声序列。??表4-5残差白噪声检验统计量??Table?4-5?Residual?white?noise?test?statistics??lags?Ibvalue?pvalue??6?2.3214047?0.88789548??12?17.42198657?0.13440113??24?34.51895957?0.0758593??D-W检验,即检
【参考文献】:
期刊论文
[1]基于小波分解及Arima误差修正的径流预测模型及应用[J]. 包丽娜,唐德善,胡晓波,楚士冀. 长江科学院院报. 2018(12)
[2]签到数据的热点区域时空模式与情感变化的可视化分析[J]. 蔡莉,潘俊,魏宝乐,周怡帆,李英姿. 小型微型计算机系统. 2018(09)
[3]学习行为数据仓库构建研究[J]. 代巧玲,李振. 软件导刊. 2018(10)
[4]面向海洋数据的复杂网络建模及可视化分析[J]. 孙鑫,李振华,董军宇,罗新艳,杨玉婷. 系统仿真学报. 2018(07)
[5]基于距离权值的C4.5组合决策树算法[J]. 杜景林,严蔚岚. 计算机工程与设计. 2018(01)
[6]基于季节性ARIMA模型的小区供水预测[J]. 郑浩然,潘雨青,李世伟,徐爱平. 计算机应用与软件. 2018(01)
[7]基于聚类算法的学生消费行为分析研究和应用[J]. 游香薷,王业,杨抒,王斌. 自动化技术与应用. 2017(12)
[8]大数据下的高校学生管理可视化平台研究[J]. 陈凤. 软件工程. 2017(06)
[9]校园卡数据分析平台建设与应用探索[J]. 田小萍,陈金焘,王兴建,符佳佳. 华中师范大学学报(自然科学版). 2017(S1)
[10]基于消费数据的食堂排队预测系统的研究[J]. 江若莹,刘欢,安金聚,彭伟,沈富可. 华中师范大学学报(自然科学版). 2017(S1)
硕士论文
[1]基于校园一卡通系统的决策支持和数据分析研究[D]. 田雨露.北京化工大学 2018
[2]基于学生行为的成绩预测模型的研究与应用[D]. 刘譞.电子科技大学 2017
[3]学习行为分析与学业预警系统研究与设计[D]. 孙昊.苏州大学 2017
[4]大数据可视化对某高校学生行为分析的呈现[D]. 王国琼.山东大学 2016
[5]基于D3.js的数据可视化系统框架设计与实现[D]. 权鑫.北京交通大学 2016
[6]异构环境下MapReduce任务推测执行算法研究[D]. 叶君炎.湖南大学 2016
[7]基于数据可视化的MOOCs统计分析[D]. 聂川茗.华中科技大学 2016
[8]基于大数据和性格模型的大学生校园行为模式的研究及其应用[D]. 曹奕.电子科技大学 2016
本文编号:2962978
【文章来源】:北京化工大学北京市 211工程院校 教育部直属院校
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
图3-3消费统计OLAP结构??Fig.3-3?Consumption?Statistics?OLAP?Structure??3.2.2?ETL调度系统设计??ETL是构建数据仓库的必要步骤
?第四章基于数据挖掘技术的分析???表4-1时间序列示例??Table?4-1?Time?Series?Example??时段?人流量??2018-10-22?14:00-15:00?10??2018-10-22?15:00-16:00?143??2018-10-22?16:00-17:00?211??2018-10-22?17:00-18:00?206??2018-10-22?18:00-19:00?244??2018-10-22?19:00-20:00?179??2018-10-22?20:00-21:00?229??2018-10-22?21:00-22:00?48??2018-10-23?14:00-15:00?10??2018-10-23?15:00-16:00?106???????????????4.1.4实验结果与分析??(1)对时间序列进行平稳性检验??对原始时间序列数据作图,如图4-2所示。通过观察法可以看出,序列在150??左右上下波动,没有明显的趋势性,基本平稳。但仍需要进行ADF检验,通过自??动化程序判断序列是否平稳。??35〇???raw?time?series???〗:l』y?iiiwii??I”。??100?-?.??5。11⑴j?11?j卩11丨11卜??〇l?i?i?^——.——?i?:???0?20?40?60?80?100?120?140??nobs??图4-2原始真实时间序列数据??Fig.4-2?Raw?time?series?data??29??
?第四章基于数据挖掘技术的分析????raw.?acf?|??raw?pacf??i〇?1?i.〇r—??0.8??0.5?°'6??0.2?—??M^nTF^TTF^TT?」丨二??-?'?■?i?M ̄ ̄|?I?11?n?f?i?*??-0.2?’…??’'…—??—?■??-〇.5?一'm?.??-0.4????0?5?10?15?20?0?5?10?15?20??图4-3自相关和偏自相关函数图??Fig.4-3?Autocorrelation?and?partial?autocorrelation?function?graph??(4)模型验证??对ARMA?(14,2)分别进行残差检验和D-W检验。残差检验,即检验残差序??列是否为白噪声序列检验。因为原始时间序列为非白噪序列,若残差序列为白噪??声序列,则说明原始时间序列中的有用信息己经全部被提取,剩余信息均为随机??扰动,是无法用于预测的。统计量如表4-5所示。延迟阶数分别为6、12、24时,??pvalue值均大于0.05,说明残差序列为白噪声序列。一般,当延迟阶数为1-12且??pvalue值均大于0.05时,序列为白噪声序列。??表4-5残差白噪声检验统计量??Table?4-5?Residual?white?noise?test?statistics??lags?Ibvalue?pvalue??6?2.3214047?0.88789548??12?17.42198657?0.13440113??24?34.51895957?0.0758593??D-W检验,即检
【参考文献】:
期刊论文
[1]基于小波分解及Arima误差修正的径流预测模型及应用[J]. 包丽娜,唐德善,胡晓波,楚士冀. 长江科学院院报. 2018(12)
[2]签到数据的热点区域时空模式与情感变化的可视化分析[J]. 蔡莉,潘俊,魏宝乐,周怡帆,李英姿. 小型微型计算机系统. 2018(09)
[3]学习行为数据仓库构建研究[J]. 代巧玲,李振. 软件导刊. 2018(10)
[4]面向海洋数据的复杂网络建模及可视化分析[J]. 孙鑫,李振华,董军宇,罗新艳,杨玉婷. 系统仿真学报. 2018(07)
[5]基于距离权值的C4.5组合决策树算法[J]. 杜景林,严蔚岚. 计算机工程与设计. 2018(01)
[6]基于季节性ARIMA模型的小区供水预测[J]. 郑浩然,潘雨青,李世伟,徐爱平. 计算机应用与软件. 2018(01)
[7]基于聚类算法的学生消费行为分析研究和应用[J]. 游香薷,王业,杨抒,王斌. 自动化技术与应用. 2017(12)
[8]大数据下的高校学生管理可视化平台研究[J]. 陈凤. 软件工程. 2017(06)
[9]校园卡数据分析平台建设与应用探索[J]. 田小萍,陈金焘,王兴建,符佳佳. 华中师范大学学报(自然科学版). 2017(S1)
[10]基于消费数据的食堂排队预测系统的研究[J]. 江若莹,刘欢,安金聚,彭伟,沈富可. 华中师范大学学报(自然科学版). 2017(S1)
硕士论文
[1]基于校园一卡通系统的决策支持和数据分析研究[D]. 田雨露.北京化工大学 2018
[2]基于学生行为的成绩预测模型的研究与应用[D]. 刘譞.电子科技大学 2017
[3]学习行为分析与学业预警系统研究与设计[D]. 孙昊.苏州大学 2017
[4]大数据可视化对某高校学生行为分析的呈现[D]. 王国琼.山东大学 2016
[5]基于D3.js的数据可视化系统框架设计与实现[D]. 权鑫.北京交通大学 2016
[6]异构环境下MapReduce任务推测执行算法研究[D]. 叶君炎.湖南大学 2016
[7]基于数据可视化的MOOCs统计分析[D]. 聂川茗.华中科技大学 2016
[8]基于大数据和性格模型的大学生校园行为模式的研究及其应用[D]. 曹奕.电子科技大学 2016
本文编号:2962978
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2962978.html