改进的频繁项集挖掘算法及其应用研究
发布时间:2021-07-18 06:23
频繁模式增长(FP-growth)算法是挖掘频繁项集的经典算法,解决了挖掘频繁项集时需多次扫描数据库且产生大量候选项集的问题,但大多数基于FP-growth思想的算法在生成频繁项集时存在过程复杂、占用空间多的问题。为此,提出一种基于前序完全构造链表(PF-List)的频繁项集挖掘算法(PFLFIM)。该算法使用PF-List表示项集,通过简单比较和连接两个PF-List挖掘频繁项集,避免复杂的连接操作;使用包含索引、提前停止交集和父子等价策略对搜索空间进行优化,减少空间占用。通过实验验证,相比于FIN算法和negFIN算法,该算法在运行时间和内存占用方面具有更好的性能。将该算法应用于高校人力资源管理系统中进行关联规则挖掘,寻找影响人才发展的因素,为高校人才引进和选拔提供决策支持。
【文章来源】:计算机应用与软件. 2019,36(09)北大核心
【文章页数】:10 页
【文章目录】:
0 引 言
1 相关概念
1.1 基本概念
1.2 PFC-tree
1.3 PF-List的概念与性质
2 基于PF-List的频繁项集挖掘算法
2.1 频繁项集挖掘
2.1.1 模式搜索树
2.1.2 优化策略
2.2 PFLFIM算法描述
3 实验结果与分析
4 PFLFIM算法在高校人才引进中应用
4.1 数据处理
(1) 数据清理。
(2) 特征构造。
(3) 人才模型构建。
(4) 数据集成。
(5) 数据转换。
4.2 关联规则挖掘
4.3 规则分析
5 结 语
【参考文献】:
期刊论文
[1]基于Nodeset的最大频繁项集挖掘算法[J]. 林晨,顾君忠. 计算机工程. 2016(12)
[2]关联规则挖掘综述[J]. 崔妍,包志强. 计算机应用研究. 2016(02)
[3]NB-MAFIA:基于N-List的最长频繁项集挖掘算法[J]. 沈戈晖,刘沛东,邓志鸿. 北京大学学报(自然科学版). 2016(02)
本文编号:3289030
【文章来源】:计算机应用与软件. 2019,36(09)北大核心
【文章页数】:10 页
【文章目录】:
0 引 言
1 相关概念
1.1 基本概念
1.2 PFC-tree
1.3 PF-List的概念与性质
2 基于PF-List的频繁项集挖掘算法
2.1 频繁项集挖掘
2.1.1 模式搜索树
2.1.2 优化策略
2.2 PFLFIM算法描述
3 实验结果与分析
4 PFLFIM算法在高校人才引进中应用
4.1 数据处理
(1) 数据清理。
(2) 特征构造。
(3) 人才模型构建。
(4) 数据集成。
(5) 数据转换。
4.2 关联规则挖掘
4.3 规则分析
5 结 语
【参考文献】:
期刊论文
[1]基于Nodeset的最大频繁项集挖掘算法[J]. 林晨,顾君忠. 计算机工程. 2016(12)
[2]关联规则挖掘综述[J]. 崔妍,包志强. 计算机应用研究. 2016(02)
[3]NB-MAFIA:基于N-List的最长频繁项集挖掘算法[J]. 沈戈晖,刘沛东,邓志鸿. 北京大学学报(自然科学版). 2016(02)
本文编号:3289030
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3289030.html