复杂网络数据流频繁项集人工智能挖掘仿真
发布时间:2020-12-12 11:32
针对传统的复杂网络数据流频繁项集人工智能挖掘方法存在数据挖掘时间较长、准确性较低等问题,提出一种基于时间戳的复杂网络数据流频繁项集人工智能挖掘方法。在训练阶段,利用贝叶斯分类算法找到所有复杂网络数据流频繁项集,并计算不同复杂网络数据流频繁项集的概率估值,在测试阶段,针对不同的测试样本构造不同的分类器,集成分类器,获取分类结果。通过分类结果,构建时间戳的滑动窗口模型,根据滑动窗口的大小对项集进行延迟处理,当项集的类型变化界限超过一定的阈值时,需要重新计算支持度,根据计算结果更新变化界限,完成复杂网络数据流频繁项集人工智能挖掘。实验结果表明,所提方法能够快速、准确地对数据流频繁项集进行人工智能挖掘。
【文章来源】:计算机仿真. 2020年04期 第330-334页 北大核心
【文章页数】:5 页
【部分图文】:
所提方法的数据流频繁项集人工智能挖掘时间
基于改进Spark的复杂网络数据流频繁项集人工智能挖掘方法的数据流频繁项集人工智能挖掘时间
图2 基于改进Spark的复杂网络数据流频繁项集人工智能挖掘方法的数据流频繁项集人工智能挖掘时间分析图1可知,所提方法的频繁项集人工智能挖掘时间一直处于平稳上升的趋势,但是上升幅度较小。分析图2可知,基于改进Spark的复杂网络数据流频繁项集人工智能挖掘方法的频繁项集人工智能挖掘时间也一直处于上升的趋势,但是上升幅度相比所提方法要大很多,最长时间达到了9.2分钟。分析图3可知,基于改进FPTree的复杂网络数据流频繁项集人工智能挖掘方法的数据流频繁项集人工智能挖掘时间一直处于不稳定的状态,忽高忽低,与所提方法相比,还存在一定的差距。通过上述实验对比可知,所提方法的数据流频繁项集人工智能挖掘时间在3种方法中为最低,所提方法能够有效减少数据挖掘时间,提高数据挖掘效率。
【参考文献】:
期刊论文
[1]基于数据集稀疏度的频繁项集挖掘算法性能分析[J]. 肖文,胡娟. 计算机应用. 2018(04)
[2]高效的数据流完全频繁项集挖掘算法[J]. 茹蓓,贺新征. 计算机工程与设计. 2017(10)
[3]基于Spark改进的最大频繁项集挖掘算法[J]. 焦润海,张谦,陈超. 计算机工程与设计. 2017(07)
[4]非结构化网络中有价值信息数据挖掘研究[J]. 林媛. 计算机仿真. 2017(02)
[5]基于数据挖掘的煤矿大数据可视化管理平台研究[J]. 申琢,谭章禄. 中国煤炭. 2016(12)
[6]时间序列数据挖掘的相似性度量综述[J]. 陈海燕,刘晨晖,孙博. 控制与决策. 2017(01)
[7]基于数据挖掘的楼宇短期负荷预测方法研究[J]. 林顺富,郝朝,汤晓栋,李东东,符杨. 电力系统保护与控制. 2016(07)
[8]《中医方剂大辞典》含丹参、红花药对组方规律数据挖掘分析[J]. 崔一然,刘欣,申丹,杨洪军,唐仕欢. 中国中药杂志. 2016(03)
[9]弧后盆地玄武岩(BABB)数据挖掘:与MORB及IAB的对比[J]. 杨婧,王金荣,张旗,陈万峰,潘振杰,焦守涛,王淑华. 地球科学进展. 2016(01)
[10]不确定数据流最大频繁项集挖掘算法研究[J]. 刘慧婷,候明利,赵鹏,姚晟. 计算机工程与应用. 2016(19)
本文编号:2912476
【文章来源】:计算机仿真. 2020年04期 第330-334页 北大核心
【文章页数】:5 页
【部分图文】:
所提方法的数据流频繁项集人工智能挖掘时间
基于改进Spark的复杂网络数据流频繁项集人工智能挖掘方法的数据流频繁项集人工智能挖掘时间
图2 基于改进Spark的复杂网络数据流频繁项集人工智能挖掘方法的数据流频繁项集人工智能挖掘时间分析图1可知,所提方法的频繁项集人工智能挖掘时间一直处于平稳上升的趋势,但是上升幅度较小。分析图2可知,基于改进Spark的复杂网络数据流频繁项集人工智能挖掘方法的频繁项集人工智能挖掘时间也一直处于上升的趋势,但是上升幅度相比所提方法要大很多,最长时间达到了9.2分钟。分析图3可知,基于改进FPTree的复杂网络数据流频繁项集人工智能挖掘方法的数据流频繁项集人工智能挖掘时间一直处于不稳定的状态,忽高忽低,与所提方法相比,还存在一定的差距。通过上述实验对比可知,所提方法的数据流频繁项集人工智能挖掘时间在3种方法中为最低,所提方法能够有效减少数据挖掘时间,提高数据挖掘效率。
【参考文献】:
期刊论文
[1]基于数据集稀疏度的频繁项集挖掘算法性能分析[J]. 肖文,胡娟. 计算机应用. 2018(04)
[2]高效的数据流完全频繁项集挖掘算法[J]. 茹蓓,贺新征. 计算机工程与设计. 2017(10)
[3]基于Spark改进的最大频繁项集挖掘算法[J]. 焦润海,张谦,陈超. 计算机工程与设计. 2017(07)
[4]非结构化网络中有价值信息数据挖掘研究[J]. 林媛. 计算机仿真. 2017(02)
[5]基于数据挖掘的煤矿大数据可视化管理平台研究[J]. 申琢,谭章禄. 中国煤炭. 2016(12)
[6]时间序列数据挖掘的相似性度量综述[J]. 陈海燕,刘晨晖,孙博. 控制与决策. 2017(01)
[7]基于数据挖掘的楼宇短期负荷预测方法研究[J]. 林顺富,郝朝,汤晓栋,李东东,符杨. 电力系统保护与控制. 2016(07)
[8]《中医方剂大辞典》含丹参、红花药对组方规律数据挖掘分析[J]. 崔一然,刘欣,申丹,杨洪军,唐仕欢. 中国中药杂志. 2016(03)
[9]弧后盆地玄武岩(BABB)数据挖掘:与MORB及IAB的对比[J]. 杨婧,王金荣,张旗,陈万峰,潘振杰,焦守涛,王淑华. 地球科学进展. 2016(01)
[10]不确定数据流最大频繁项集挖掘算法研究[J]. 刘慧婷,候明利,赵鹏,姚晟. 计算机工程与应用. 2016(19)
本文编号:2912476
本文链接:https://www.wllwen.com/kejilunwen/rengongzhinen/2912476.html