时间序列聚类在学习行为分析上的应用研究
发布时间:2021-07-22 04:02
随着MOOC技术的发展,各高校也开始建立自己的云课堂学习平台,云课堂上有大量的学习数据,而在大数据时代,对数据的挖掘和分析显得尤为重要。聚类分析也是无监督学习,模糊聚类提出后被广泛应用,模糊C均值聚类算法(Fuzzy C-Means,FCM)是一种重要的模糊聚类方法。时间序列分析是一个古老的课题,发展到现在已被广泛应用于各领域。时间序列聚类虽然应用广泛,但在教育领域的应用还较少。时间序列模型用曲线拟合时间序列数据,并可预测序列未来趋势。本文根据分析结果采取自回归移动平均(Auto-Regressive and Moving Avergae,ARMA)模型进行拟合预测。本文通过分析某高校云课堂学习行为数据,发现了云课堂学习平台数据的特性。学习行为数据是一个时间序列,在对学习用户进行聚类的时候,使用样本点与聚类中心的时间序列相似距离来代替样本点与聚类中心的欧式距离,根据数据特征采用动态时间弯曲距离(Dynamics Time Wraping,DTW)来计算样本点与聚类中心的时间序列相似距离,设计出基于DTW的模糊C均值聚类算法(DTW-FCM),并对经过预处理的学习用户数据进行基于DTW的...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图3.1学习数据表(data)??
女?文字陕?汉语密文字(蹄范)_420?86??201321?茫?sr?(mm)?_42〇?as??201321?m?V'?文字疾?汉遙客又字(_通}?_420?S2??201321?徐?女?文字^?汉il宮文字(蹄范)_420?S9??201321?张?女?cmm.)?_42〇?&s??201521?兹?女?文字联?汉语赛文字(师范)_42〇?87??201321?张?女?域市与5^墳衫字字晓人文乡规划_41?5?82??图3.2学生信息表(userinfo)??2)预处理数据??分析数据表中的内容,可以根据现有的信息,运用mysql和excel进行处理,??得到每个学生学习总时长和学习次数,放进表stuTotaltime中,如图3.3所示,包含??了学号(userid)、姓名(username)、性别(sex)、学院(college)、专业(major)、??云课堂系统id?(SysAppId)、设备系统(SysOs)、学习总时长(totaltime,以秒为??单位)、总学习次数(studycount)、分数(score)等字段。还可以得到每天的学??习时长,放进表stuBehavior中,如图3.4所示,stuBehavior表中包含了学号(userid)、??姓名(username)、性别(sex)、云课堂系统id?(SysAppId)、设备系统(SysOs)、??事件发生时间(eventtime,包含的事件发生的早期和时间点)、学院(college)、??专业(major)、日期(date,是通过eventtime得到的)、时间(time,对应日期的??
女?文字陕?汉语密文字(蹄范)_420?86??201321?茫?sr?(mm)?_42〇?as??201321?m?V'?文字疾?汉遙客又字(_通}?_420?S2??201321?徐?女?文字^?汉il宮文字(蹄范)_420?S9??201321?张?女?cmm.)?_42〇?&s??201521?兹?女?文字联?汉语赛文字(师范)_42〇?87??201321?张?女?域市与5^墳衫字字晓人文乡规划_41?5?82??图3.2学生信息表(userinfo)??2)预处理数据??分析数据表中的内容,可以根据现有的信息,运用mysql和excel进行处理,??得到每个学生学习总时长和学习次数,放进表stuTotaltime中,如图3.3所示,包含??了学号(userid)、姓名(username)、性别(sex)、学院(college)、专业(major)、??云课堂系统id?(SysAppId)、设备系统(SysOs)、学习总时长(totaltime,以秒为??单位)、总学习次数(studycount)、分数(score)等字段。还可以得到每天的学??习时长,放进表stuBehavior中,如图3.4所示,stuBehavior表中包含了学号(userid)、??姓名(username)、性别(sex)、云课堂系统id?(SysAppId)、设备系统(SysOs)、??事件发生时间(eventtime,包含的事件发生的早期和时间点)、学院(college)、??专业(major)、日期(date,是通过eventtime得到的)、时间(time,对应日期的??
【参考文献】:
期刊论文
[1]基于时间序列的电能表月故障数预测方法[J]. 李媛,郑安刚,谭煌,陈昊,程淑亚,蔡慧,王黎欣. 中国电力. 2020(06)
[2]时间序列预测方法综述[J]. 杨海民,潘志松,白玮. 计算机科学. 2019(01)
[3]时间序列数据挖掘的相似性度量综述[J]. 陈海燕,刘晨晖,孙博. 控制与决策. 2017(01)
[4]教育数据挖掘研究进展综述[J]. 周庆,牟超,杨丹. 软件学报. 2015(11)
[5]时间序列的表示与分类算法综述[J]. 原继东,王志海. 计算机科学. 2015(03)
[6]不确定时间序列的降维及相似性匹配[J]. 王伟,刘国华,徐斌. 计算机科学与探索. 2015(04)
[7]模糊C均值聚类下的医学图像分割探讨[J]. 辛国江,占艳,韦昌法,穆珺,周燃犀. 硅谷. 2014(13)
[8]基于SARMA模型的我国粗钢产量时间序列分析与预测[J]. 廖冰清. 企业导报. 2012(24)
[9]一种基于关键点的时间序列聚类算法[J]. 谢福鼎,李迎,孙岩,张永. 计算机科学. 2012(03)
[10]基于方差波动多重分形特征的金融时间序列聚类[J]. 黄超,吴清烈,武忠,朱扬勇. 系统工程. 2006(06)
博士论文
[1]时间序列数据分类、检索方法及应用研究[D]. 郑毅.中国科学技术大学 2015
[2]时间序列数据挖掘若干关键问题研究[D]. 何晓旭.中国科学技术大学 2014
[3]时间序列数据挖掘中的维数约简与预测方法研究[D]. 孙友强.中国科学技术大学 2014
硕士论文
[1]基于密度度量的大样本时间序列聚类分析和预测方法研究[D]. 程佳宇.武汉大学 2018
[2]基于特性分析的交通流时间序列聚类[D]. 吴冕.北京交通大学 2017
[3]交通流时间序列的聚类分析方法及应用[D]. 李强.北京交通大学 2012
[4]模糊聚类分析技术及其应用研究[D]. 叶海军.合肥工业大学 2006
本文编号:3296393
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图3.1学习数据表(data)??
女?文字陕?汉语密文字(蹄范)_420?86??201321?茫?sr?(mm)?_42〇?as??201321?m?V'?文字疾?汉遙客又字(_通}?_420?S2??201321?徐?女?文字^?汉il宮文字(蹄范)_420?S9??201321?张?女?cmm.)?_42〇?&s??201521?兹?女?文字联?汉语赛文字(师范)_42〇?87??201321?张?女?域市与5^墳衫字字晓人文乡规划_41?5?82??图3.2学生信息表(userinfo)??2)预处理数据??分析数据表中的内容,可以根据现有的信息,运用mysql和excel进行处理,??得到每个学生学习总时长和学习次数,放进表stuTotaltime中,如图3.3所示,包含??了学号(userid)、姓名(username)、性别(sex)、学院(college)、专业(major)、??云课堂系统id?(SysAppId)、设备系统(SysOs)、学习总时长(totaltime,以秒为??单位)、总学习次数(studycount)、分数(score)等字段。还可以得到每天的学??习时长,放进表stuBehavior中,如图3.4所示,stuBehavior表中包含了学号(userid)、??姓名(username)、性别(sex)、云课堂系统id?(SysAppId)、设备系统(SysOs)、??事件发生时间(eventtime,包含的事件发生的早期和时间点)、学院(college)、??专业(major)、日期(date,是通过eventtime得到的)、时间(time,对应日期的??
女?文字陕?汉语密文字(蹄范)_420?86??201321?茫?sr?(mm)?_42〇?as??201321?m?V'?文字疾?汉遙客又字(_通}?_420?S2??201321?徐?女?文字^?汉il宮文字(蹄范)_420?S9??201321?张?女?cmm.)?_42〇?&s??201521?兹?女?文字联?汉语赛文字(师范)_42〇?87??201321?张?女?域市与5^墳衫字字晓人文乡规划_41?5?82??图3.2学生信息表(userinfo)??2)预处理数据??分析数据表中的内容,可以根据现有的信息,运用mysql和excel进行处理,??得到每个学生学习总时长和学习次数,放进表stuTotaltime中,如图3.3所示,包含??了学号(userid)、姓名(username)、性别(sex)、学院(college)、专业(major)、??云课堂系统id?(SysAppId)、设备系统(SysOs)、学习总时长(totaltime,以秒为??单位)、总学习次数(studycount)、分数(score)等字段。还可以得到每天的学??习时长,放进表stuBehavior中,如图3.4所示,stuBehavior表中包含了学号(userid)、??姓名(username)、性别(sex)、云课堂系统id?(SysAppId)、设备系统(SysOs)、??事件发生时间(eventtime,包含的事件发生的早期和时间点)、学院(college)、??专业(major)、日期(date,是通过eventtime得到的)、时间(time,对应日期的??
【参考文献】:
期刊论文
[1]基于时间序列的电能表月故障数预测方法[J]. 李媛,郑安刚,谭煌,陈昊,程淑亚,蔡慧,王黎欣. 中国电力. 2020(06)
[2]时间序列预测方法综述[J]. 杨海民,潘志松,白玮. 计算机科学. 2019(01)
[3]时间序列数据挖掘的相似性度量综述[J]. 陈海燕,刘晨晖,孙博. 控制与决策. 2017(01)
[4]教育数据挖掘研究进展综述[J]. 周庆,牟超,杨丹. 软件学报. 2015(11)
[5]时间序列的表示与分类算法综述[J]. 原继东,王志海. 计算机科学. 2015(03)
[6]不确定时间序列的降维及相似性匹配[J]. 王伟,刘国华,徐斌. 计算机科学与探索. 2015(04)
[7]模糊C均值聚类下的医学图像分割探讨[J]. 辛国江,占艳,韦昌法,穆珺,周燃犀. 硅谷. 2014(13)
[8]基于SARMA模型的我国粗钢产量时间序列分析与预测[J]. 廖冰清. 企业导报. 2012(24)
[9]一种基于关键点的时间序列聚类算法[J]. 谢福鼎,李迎,孙岩,张永. 计算机科学. 2012(03)
[10]基于方差波动多重分形特征的金融时间序列聚类[J]. 黄超,吴清烈,武忠,朱扬勇. 系统工程. 2006(06)
博士论文
[1]时间序列数据分类、检索方法及应用研究[D]. 郑毅.中国科学技术大学 2015
[2]时间序列数据挖掘若干关键问题研究[D]. 何晓旭.中国科学技术大学 2014
[3]时间序列数据挖掘中的维数约简与预测方法研究[D]. 孙友强.中国科学技术大学 2014
硕士论文
[1]基于密度度量的大样本时间序列聚类分析和预测方法研究[D]. 程佳宇.武汉大学 2018
[2]基于特性分析的交通流时间序列聚类[D]. 吴冕.北京交通大学 2017
[3]交通流时间序列的聚类分析方法及应用[D]. 李强.北京交通大学 2012
[4]模糊聚类分析技术及其应用研究[D]. 叶海军.合肥工业大学 2006
本文编号:3296393
本文链接:https://www.wllwen.com/jiaoyulunwen/ktjx/3296393.html