基于FP-growth关联规则的图书馆数据快速挖掘算法研究
发布时间:2021-08-03 08:45
作为一种模糊关联规则挖掘算法,FP-growth算法在执行效率上明显优于Apriori算法。但是由于模糊属性的不足和空间复杂度较大,导致FP-growth算法在处理大型事务数据库,例如图书馆数据库时,无法实现有效的多层关联规则挖掘。因此,提出一种改进的FP-growth关联规则算法,能够快速向读者进行个性化图书推荐。首先,该算法把大型图书事务数据库根据首项的事务,划分为若干子数据库,并构建相应的子FP-tree结构;然后,采用实时过滤掉层次树中不是频繁项的父项来缩小扫描空间。实验结果表明:相比Apriori算法和标准FP-growth算法,提出的改进FP-growth关联规则算法在运行效率方面有明显提升,为图书的推荐工作提供了科学依据。
【文章来源】:重庆理工大学学报(自然科学). 2020,34(06)北大核心
【文章页数】:6 页
【部分图文】:
FP-tree节点
在构建FP-tree树之后,就要从FP-tree中挖掘频繁模式,按照支持度降序排列,仅保留频繁项集,剔除那些低于支持度阈值的项,建立m(m结尾的节点链和频繁项集)的条件FP-tree[18],如图2所示。2 FP_Growth关联规则的改进
3)重新搜索数据库珟D,按照首项Ii(i=1,2,…,m-1,m)将事物存储进对应的链表组Vi(i=1,2,…,m-1,m)中,即完成子数据库的划分,按照数据链表的首项构建FP-tree结构的示例如图3所示。4)构建每个Vi的子FP-tree结构,根据频繁1-项集的支持度计数大小,将Vi进行降序排序,占用的内存相对较少,从而减少了构建FP-tree结构的时间。
【参考文献】:
期刊论文
[1]分布式空间数据库中有效数据频繁项实时检测[J]. 尚晓丽,包向辉. 科学技术与工程. 2018(19)
[2]基于改进Apriori算法的审计日志关联规则挖掘[J]. 徐开勇,龚雪容,成茂才. 计算机应用. 2016(07)
[3]基于关联规则的高校图书信息数据挖掘[J]. 王娜,岳俊英. 信息系统工程. 2014(02)
本文编号:3319316
【文章来源】:重庆理工大学学报(自然科学). 2020,34(06)北大核心
【文章页数】:6 页
【部分图文】:
FP-tree节点
在构建FP-tree树之后,就要从FP-tree中挖掘频繁模式,按照支持度降序排列,仅保留频繁项集,剔除那些低于支持度阈值的项,建立m(m结尾的节点链和频繁项集)的条件FP-tree[18],如图2所示。2 FP_Growth关联规则的改进
3)重新搜索数据库珟D,按照首项Ii(i=1,2,…,m-1,m)将事物存储进对应的链表组Vi(i=1,2,…,m-1,m)中,即完成子数据库的划分,按照数据链表的首项构建FP-tree结构的示例如图3所示。4)构建每个Vi的子FP-tree结构,根据频繁1-项集的支持度计数大小,将Vi进行降序排序,占用的内存相对较少,从而减少了构建FP-tree结构的时间。
【参考文献】:
期刊论文
[1]分布式空间数据库中有效数据频繁项实时检测[J]. 尚晓丽,包向辉. 科学技术与工程. 2018(19)
[2]基于改进Apriori算法的审计日志关联规则挖掘[J]. 徐开勇,龚雪容,成茂才. 计算机应用. 2016(07)
[3]基于关联规则的高校图书信息数据挖掘[J]. 王娜,岳俊英. 信息系统工程. 2014(02)
本文编号:3319316
本文链接:https://www.wllwen.com/tushudanganlunwen/3319316.html