一种多维多层的关联规则挖掘算法在教育数据上的应用
发布时间:2020-12-22 02:26
科技日新月异,各大高校作为技术人才孕育的摇篮,许多未来社会的改变正由此处悄然诞生。大部分高校都已经拥有了自己的教育平台,在这样的平台里,每天都有大量数据产生,合理地挖掘利用这些数据会为师生甚至教育指导带来很重要的意义。教学成绩作为教育数据中很重要的一个部分,它能在一定程度上直观地反应学生学习情况和教学质量。本文应用数据挖掘中的关联规则技术来对教学成绩数据进行分析提取,并将得到的有意义的成果用作教学指导,学生培养方面的依据。关联规则是数据挖掘技术中不可获取的一类算法,主要目的是分析发现数据之间存在的关联。本文的研究目的正是通过挖掘教学成绩来发现课程之间存在的关联,因此采用了关联规则作为本文实验的主要方法。本文对关联规则进行了深入的研究分析,梳理了关联规则的发展历史,并且结合其他学者的研究内容,提出了一种多维多层的关联规则挖掘算法MMSP。本文结合实际数据,对学生成绩进行关联分析。遵循数据挖掘流程,收集实验所需数据,对数据进行了相关的预处理,获得可以适合算法的数据模型;接下来使用相关算法对数据进行挖掘:首先是使用FP-growth算法对无时序关联的课程维度进行处理;然后使用MMSP算法只针...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
数据挖掘主要任务
睦┱埂>倮?得鳎?ü齕A]={C,D,T,W}可以得到[AC]={D,T,W},[AD]={T,W},[AT]={W}。垂直方法像 Eclat 算法[62]就是使用这种类的独立性进行频繁模式枚举。图3.1.2 展示出了典型的垂直挖掘过程。例如,可以相交 A(t(A)= 1345)和 D(t(D)= 2456)的 tidset 以获得不频繁的 AD(t(AD)= 45)的 tidset。由此可以看出,在密集的数据中,t 头的大小可能变得非常大。Diffset 策略是使用差异概念来解决这个问题的。
图 3.2 tidsets 的模式计算set 策略的目的是避免存储每一个类成员的完整 tidset。个类成员和类前缀项集之间 tidsets 中有差异的轨迹,补充说明,这些差异是由根几点开始,遍历所有路径向其孩成员可以使用完整的 tidsets。进制来增强垂直挖掘有两种方法,可以选择从频繁项目的开始就将 tidset 表示转换为 di 集合表示。如果从 tidse集如 AD,d(AD)=t(A)-T(D)=13(当不会产生混乱时,使用省略繁的,我们检查σ( ) d( D) 4 2 2,因此 AD 不是sets 开始,将会发现 d(AD)=d(D)-d(A)=13-26=13,可以看虽然简单,但是也可以清楚地观察到,对于如图中所示的ffset 策略实现了数据库大小的大幅减少。
【参考文献】:
期刊论文
[1]基于关联规则挖掘的元器件可靠性数据分析模型[J]. 刘启越,刘晓宇. 环境技术. 2019(S2)
[2]关联规则及Apriori算法的大学生行为分析研究[J]. 张华霞,李秋生,蒲蓬勃. 赣南师范大学学报. 2018(03)
本文编号:2930964
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
数据挖掘主要任务
睦┱埂>倮?得鳎?ü齕A]={C,D,T,W}可以得到[AC]={D,T,W},[AD]={T,W},[AT]={W}。垂直方法像 Eclat 算法[62]就是使用这种类的独立性进行频繁模式枚举。图3.1.2 展示出了典型的垂直挖掘过程。例如,可以相交 A(t(A)= 1345)和 D(t(D)= 2456)的 tidset 以获得不频繁的 AD(t(AD)= 45)的 tidset。由此可以看出,在密集的数据中,t 头的大小可能变得非常大。Diffset 策略是使用差异概念来解决这个问题的。
图 3.2 tidsets 的模式计算set 策略的目的是避免存储每一个类成员的完整 tidset。个类成员和类前缀项集之间 tidsets 中有差异的轨迹,补充说明,这些差异是由根几点开始,遍历所有路径向其孩成员可以使用完整的 tidsets。进制来增强垂直挖掘有两种方法,可以选择从频繁项目的开始就将 tidset 表示转换为 di 集合表示。如果从 tidse集如 AD,d(AD)=t(A)-T(D)=13(当不会产生混乱时,使用省略繁的,我们检查σ( ) d( D) 4 2 2,因此 AD 不是sets 开始,将会发现 d(AD)=d(D)-d(A)=13-26=13,可以看虽然简单,但是也可以清楚地观察到,对于如图中所示的ffset 策略实现了数据库大小的大幅减少。
【参考文献】:
期刊论文
[1]基于关联规则挖掘的元器件可靠性数据分析模型[J]. 刘启越,刘晓宇. 环境技术. 2019(S2)
[2]关联规则及Apriori算法的大学生行为分析研究[J]. 张华霞,李秋生,蒲蓬勃. 赣南师范大学学报. 2018(03)
本文编号:2930964
本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyutizhilunwen/2930964.html