频繁模式挖掘方法的研究
发布时间:2022-12-25 10:12
如今,随着现代科学技术尤其是计算机技术的快速发展和信息系统的不断普及,我们早已置身于大数据时代。面对如此庞大的数据量,人们显得束手无策。在这样的环境下,数据挖掘产生并不断发展成熟,它综合了多门学科和领域的知识,主要有模式识别、人工智能、机器学习和统计学等等,在各领域均受到高度的重视。数据挖掘的最终目标是从看似杂乱的事务数据集中挖掘有用的知识,其中如何在海量数据集中准确高效的挖掘关联规则是一个热门的研究方向,而频繁模式挖掘是进行关联规则挖掘的第一步。本文主要对频繁模式的挖掘方法进行研究,重点研究以下几个方面:优化DiffNodest数据结构并应用到频繁项集挖掘算法中;利用改进的BPSO算法挖掘大但稀疏的数据集;结合模糊集理论与频繁项集挖掘算法发现模糊频繁项集。本文的主要研究内容如下:(1)对频繁模式挖掘方法中基于DiffNodeset数据结构的算法进行了深入的研究,针对该类算法存在的问题提出了基于BNodeset数据结构的挖掘方法,使用一种优化的节点编码方式即二进制编码方式为各节点进行编码,并利用多种优化策略对算法的搜索空间进行裁剪。通过理论分析和实验验证,证明提出的算法在挖掘频繁项集的...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 选题背景与研究意义
1.2 国内外研究现状
1.2.1 数据挖掘研究现状
1.2.2 频繁模式挖掘现状
1.3 论文组织结构
第二章 相关理论基础
2.1 关联规则描述
2.1.1 频繁模式基本概念
2.1.2 关联规则挖掘步骤
2.2 Apriori算法
2.2.1 Apriori算法简介
2.2.2 Apriori算法步骤
2.2.3 Apriori算法分析
2.3 FP-growth算法
2.3.1 FP-growth算法简介
2.3.2 FP-growth算法步骤
2.3.3 FP-growth算法分析
2.4 本章小结
第三章 基于BNodeset结构的频繁项集挖掘
3.1 引言
3.2 DiffNodeset结构
3.3 基于BNodeset结构的挖掘算法
3.3.1 二进制编码
3.3.2 BM树
3.3.3 搜索空间
3.3.4 算法描述
3.4 实验结果与分析
3.4.1 实验数据集
3.4.2 实验结果比较
3.4.3 时间复杂度对比
3.5 本章小结
第四章 基于改进BPSO的频繁项集挖掘
4.1 引言
4.2 PSO算法
4.2.1 算法描述
4.2.2 BPSO算法
4.3 基于改进BPSO的挖掘算法
4.3.1 适应度函数设计
4.3.2 初始种群预处理
4.3.3 裁剪搜索空间
4.3.4 参数调整
4.3.5 算法步骤
4.4 实验结果与分析
4.4.1 实验数据集
4.4.2 实验结果比较
4.5 本章小结
第五章 基于改进压缩树的模糊频繁项集挖掘
5.1 引言
5.2 模糊集理论
5.3 压缩模糊频繁模式树算法
5.3.1 CMFFP算法介绍
5.3.2 构造CMFFP-tree
5.4 基于改进的压缩树挖掘算法
5.4.1 改进的CMFFP-tree结构
5.4.2 搜索空间
5.5 实验结果与分析
5.5.1 实验数据集
5.5.2 实验结果比较
5.6 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
附录 :作者在攻读硕士学位期间发表的论文
【参考文献】:
期刊论文
[1]基于Spark的并行FP-Growth算法优化及实现[J]. 顾军华,武君艳,许馨匀,谢志坚,张素琪. 计算机应用. 2018(11)
[2]基于频繁项集树的时态关联规则挖掘算法[J]. 王玲,李树林,徐培培,孟建瑶,彭开香. 控制与决策. 2018(04)
[3]面向正负关联规则的方剂配伍规律挖掘算法[J]. 韩楠,乔少杰,宫兴伟,李天瑞,舒红平,元昌安. 小型微型计算机系统. 2017(07)
[4]基于数据库日志关联规则挖掘的业务流程优化[J]. 肖宗水,孟令童,孔兰菊,钱进. 计算机集成制造系统. 2017(05)
[5]基于邻接矩阵的FP-tree构造算法[J]. 刘应东,冷明伟,陈晓云. 计算机工程与应用. 2011(07)
本文编号:3726415
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 选题背景与研究意义
1.2 国内外研究现状
1.2.1 数据挖掘研究现状
1.2.2 频繁模式挖掘现状
1.3 论文组织结构
第二章 相关理论基础
2.1 关联规则描述
2.1.1 频繁模式基本概念
2.1.2 关联规则挖掘步骤
2.2 Apriori算法
2.2.1 Apriori算法简介
2.2.2 Apriori算法步骤
2.2.3 Apriori算法分析
2.3 FP-growth算法
2.3.1 FP-growth算法简介
2.3.2 FP-growth算法步骤
2.3.3 FP-growth算法分析
2.4 本章小结
第三章 基于BNodeset结构的频繁项集挖掘
3.1 引言
3.2 DiffNodeset结构
3.3 基于BNodeset结构的挖掘算法
3.3.1 二进制编码
3.3.2 BM树
3.3.3 搜索空间
3.3.4 算法描述
3.4 实验结果与分析
3.4.1 实验数据集
3.4.2 实验结果比较
3.4.3 时间复杂度对比
3.5 本章小结
第四章 基于改进BPSO的频繁项集挖掘
4.1 引言
4.2 PSO算法
4.2.1 算法描述
4.2.2 BPSO算法
4.3 基于改进BPSO的挖掘算法
4.3.1 适应度函数设计
4.3.2 初始种群预处理
4.3.3 裁剪搜索空间
4.3.4 参数调整
4.3.5 算法步骤
4.4 实验结果与分析
4.4.1 实验数据集
4.4.2 实验结果比较
4.5 本章小结
第五章 基于改进压缩树的模糊频繁项集挖掘
5.1 引言
5.2 模糊集理论
5.3 压缩模糊频繁模式树算法
5.3.1 CMFFP算法介绍
5.3.2 构造CMFFP-tree
5.4 基于改进的压缩树挖掘算法
5.4.1 改进的CMFFP-tree结构
5.4.2 搜索空间
5.5 实验结果与分析
5.5.1 实验数据集
5.5.2 实验结果比较
5.6 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
附录 :作者在攻读硕士学位期间发表的论文
【参考文献】:
期刊论文
[1]基于Spark的并行FP-Growth算法优化及实现[J]. 顾军华,武君艳,许馨匀,谢志坚,张素琪. 计算机应用. 2018(11)
[2]基于频繁项集树的时态关联规则挖掘算法[J]. 王玲,李树林,徐培培,孟建瑶,彭开香. 控制与决策. 2018(04)
[3]面向正负关联规则的方剂配伍规律挖掘算法[J]. 韩楠,乔少杰,宫兴伟,李天瑞,舒红平,元昌安. 小型微型计算机系统. 2017(07)
[4]基于数据库日志关联规则挖掘的业务流程优化[J]. 肖宗水,孟令童,孔兰菊,钱进. 计算机集成制造系统. 2017(05)
[5]基于邻接矩阵的FP-tree构造算法[J]. 刘应东,冷明伟,陈晓云. 计算机工程与应用. 2011(07)
本文编号:3726415
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3726415.html
最近更新
教材专著