基于频繁项集的流式数据挖掘算法的研究与实现
发布时间:2021-11-19 23:46
数据流是实时、高速、无限的,数据流上的频繁项集挖掘在多个领域得到了广泛的应用,如卫星监测数据分析、Web点击流分析、天气气象数据分析等。挖掘流式数据能够及时得到数据流中隐含的价值信息。由于流式数据的时变性,数据流中隐藏的信息会随着时间的推移而发生改变,这给现有的频繁项集挖掘算法带来了新的挑战。另外,最大频繁项集的项集数目相对较少并且已经包含所有的频繁项集,所以挖掘流式数据上的最大频繁项集具有很好的时空效率并且对进一步的关联规则挖掘具有指导意义。基于上述原因,本文基于滑动窗口模型和频繁项集挖掘算法前缀树实现,研究更加适应数据流时变特征的、高效的流式数据频繁项集挖掘算法,主要研究工作如下:首先,论文基于动态滑动窗口模型提出了一种嵌套窗口模型,用于快速挖掘数据流上的主要频繁项集,以满足数据流中发生的概念变化。并在此基础上提出了基于嵌套窗口模型的数据流频繁项集挖掘算法NWFI,该算法首先给定一个外嵌滑动窗口的大小,当数据流到来时将所有数据项映射到时间轴上,并使用时间衰减模型降低历史事务的权重,并由此来区分近期事务数据与历史事务数据。然后考虑每一个数据项的期望窗口值,来动态调整内嵌的挖掘窗口大小...
【文章来源】:重庆邮电大学重庆市
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
界标窗口模型
图 2.3 滑动窗口模型据具有大量、快速、无限等特点,不能将所有的事务数据都用于动窗口模型成为广泛使用的数据处理模型,它在滑动窗口上发繁项集。在这个窗口模型中,新的事务数据到来,旧的事务数
FP-tree的结构
【参考文献】:
期刊论文
[1]改进的Eclat算法研究与应用[J]. 崔馨月,孙静宇. 计算机工程与设计. 2018(04)
[2]基于B-list的最大频繁项集挖掘算法[J]. 张昌,文凯,郑云俊. 计算机应用研究. 2019(02)
[3]高效的数据流完全频繁项集挖掘算法[J]. 茹蓓,贺新征. 计算机工程与设计. 2017(10)
[4]挖掘完全频繁项集的蚁群算法[J]. 黄红星. 微电子学与计算机. 2014(12)
[5]一种基于时间衰减模型的数据流闭合模式挖掘方法[J]. 韩萌,王志海,原继东. 计算机学报. 2015(07)
[6]滑动窗口中数据流最大频繁项集挖掘算法研究[J]. 尹绍宏,单坤玉,范桂丹. 计算机工程与应用. 2015(22)
[7]基于概念格的数据流频繁项集挖掘[J]. 张长胜,阮婧,黄海隆,励龙昌,杨炳儒. 科学技术与工程. 2013(23)
[8]一种基于滑动窗口的数据流频繁项集挖掘算法[J]. 寇香霞,任永功,宋奎勇. 计算机应用与软件. 2013(01)
[9]基于向量的数据流滑动窗口中最大频繁项集挖掘[J]. 徐嘉莉,陈佳,胡庆,黄波,郭红霞. 计算机应用研究. 2012(03)
[10]基于时间衰减模型的数据流频繁模式挖掘[J]. 吴枫,仲妍,吴泉源. 自动化学报. 2010(05)
硕士论文
[1]基于频繁项集的数据流挖掘算法研究[D]. 黎海青.重庆邮电大学 2017
[2]基于倾斜时间窗口的频繁项集挖掘算法研究[D]. 徐艳红.哈尔滨工程大学 2010
[3]数据流频繁模式挖掘算法研究与设计[D]. 曹国栋.燕山大学 2007
本文编号:3506126
【文章来源】:重庆邮电大学重庆市
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
界标窗口模型
图 2.3 滑动窗口模型据具有大量、快速、无限等特点,不能将所有的事务数据都用于动窗口模型成为广泛使用的数据处理模型,它在滑动窗口上发繁项集。在这个窗口模型中,新的事务数据到来,旧的事务数
FP-tree的结构
【参考文献】:
期刊论文
[1]改进的Eclat算法研究与应用[J]. 崔馨月,孙静宇. 计算机工程与设计. 2018(04)
[2]基于B-list的最大频繁项集挖掘算法[J]. 张昌,文凯,郑云俊. 计算机应用研究. 2019(02)
[3]高效的数据流完全频繁项集挖掘算法[J]. 茹蓓,贺新征. 计算机工程与设计. 2017(10)
[4]挖掘完全频繁项集的蚁群算法[J]. 黄红星. 微电子学与计算机. 2014(12)
[5]一种基于时间衰减模型的数据流闭合模式挖掘方法[J]. 韩萌,王志海,原继东. 计算机学报. 2015(07)
[6]滑动窗口中数据流最大频繁项集挖掘算法研究[J]. 尹绍宏,单坤玉,范桂丹. 计算机工程与应用. 2015(22)
[7]基于概念格的数据流频繁项集挖掘[J]. 张长胜,阮婧,黄海隆,励龙昌,杨炳儒. 科学技术与工程. 2013(23)
[8]一种基于滑动窗口的数据流频繁项集挖掘算法[J]. 寇香霞,任永功,宋奎勇. 计算机应用与软件. 2013(01)
[9]基于向量的数据流滑动窗口中最大频繁项集挖掘[J]. 徐嘉莉,陈佳,胡庆,黄波,郭红霞. 计算机应用研究. 2012(03)
[10]基于时间衰减模型的数据流频繁模式挖掘[J]. 吴枫,仲妍,吴泉源. 自动化学报. 2010(05)
硕士论文
[1]基于频繁项集的数据流挖掘算法研究[D]. 黎海青.重庆邮电大学 2017
[2]基于倾斜时间窗口的频繁项集挖掘算法研究[D]. 徐艳红.哈尔滨工程大学 2010
[3]数据流频繁模式挖掘算法研究与设计[D]. 曹国栋.燕山大学 2007
本文编号:3506126
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3506126.html