基于蚁群算法的模式挖掘方法研究
发布时间:2021-02-23 17:13
模式挖掘是数据挖掘中最重要的领域,高效用项集挖掘是模式挖掘中的研究热点之一。由于演化计算能够避免高效用项集搜索空间组合爆炸式增长,近几年基于演化计算的高效用项集挖掘算法越来越受到关注。学者们提出了基于遗传算法(Genetic Algorithm,GA)、粒子群算法(Particle Swarm Optimization,PSO)、蝙蝠算法(Bat Algorithm,BA)等演化计算的高效用项集挖掘算法。这些方法通常通过迭代的改变编码向量产生新的候选项集。与GA、PSO、BA算法不同,我们提出了一个基于蚁群算法的高效用项集挖掘算法(HUIM-ACO),这种算法构造性地产生候选项集。在HUIM-ACO算法中,我们使用搜索路径来表达候选项集。最初我们将每个搜索路径按照概率进行初始化,每一步增加一个项目。同时我们提出了信息素矩阵,用于存储两个不同项目的信息素值,允许局部更新和全局更新,而且设计的蚂蚁路径能够有效计算高效用项集。与基于GA和PSO的高效用项集挖掘算法相比,HUIM-ACO算法能够在更短的时间内挖掘出更多的高效用项集。为了进一步提升HUIM-ACO算法的性能,在HUIM-ACO算...
【文章来源】:北方工业大学北京市
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
蚂蚁系统流程图
第二章问题描述10每个节点都表示特定项集,这个项集可以被蚂蚁评估是否是高效用项集。图2-2是递归构建的蚂蚁路径图。图2-2蚂蚁路径图2.3.2伪随机比例规则HUIM-ACS算法使用当前节点和候选节点组成项集的TWU值作为启发式函数,只计算蚂蚁第一次到达相关节点的TWU值。在伪随机比例规则中当前节点和候选节点组成项集的TWU值有以下三种情况。(1)成对的项目没有任何TWU值信息。(2)处理包含所有成对项目的TWU值。(3)一些没有处理的成对项目的TWU值。2.3.3全局更新规则HUIM-ACS算法简化了传统的全局更新公式,在每次迭代中只是使用项集效用值加强信息素浓度并且忽略挥发参数。且在每次迭代中不总是加强信息浓度,这样避免了蚂蚁路径图中一些区域路径上信息素浓度过大。这样对挖掘高效用项集是有利的,因为需要挖掘出更多的解而不是单一的最优解。2.4本章小结高效用模式挖掘主要是从给定的数据集中挖掘出所有大于指定阈值的项集。AC算法是最早提出的蚂蚁种群优化算法,主要流程是初始化蚂蚁种群,蚂蚁移动完成一次循环后在经过的路径上释放信息素,满足终止条件后算法结束。ACS
第三章基于ACO的高效用模式挖掘算法173.3.2运行时间首先,我们阐述提出的HUIM-ACO算法性能。图3-1展示了每个算法在4个数据上运行时间的对比。我们通过改变每个数据集的最小效用阈值来测量各个算法在4个数据集上的运行时间。图3-14个数据集的运行时间就Accident数据集而言,HUIM-BPSO运行了4天后都没有返回任何结果,因此在图3-1中没有标记出这个算法的任何结果,我们从图3-1中可以看出提出的HUIM-ACO算法比HUIM-BPSO算法和Bio-HUIF-GA算法快出一个量级。就Chess和Connect数据集,HUIM-ACO比Bio-HUIF-PSO快了一个数量级。值得注意的是HUIM-ACO算法运行时间总是很稳定,并且几乎没有受最小效用阈值改变的影响。3.3.3挖掘结果数量因为演化HUIM算法无法确保在一定的循环次数后所有项集的挖掘,我们比对了各个演化算法挖掘的HUIs数量。与3.4.2小结同理,我们没有绘制出在Accident数据集中HUIM-BPSO算法的结果。
【参考文献】:
期刊论文
[1]基于多效用阈值的分布式高效用序列模式挖掘[J]. 曾毅,张福泉. 计算机工程与设计. 2020(02)
[2]基于投影二维表的最大频繁模式挖掘算法[J]. 王利军. 西昌学院学报(自然科学版). 2019(04)
[3]基于Spark平台的FP-Growth算法优化与实现[J]. 黄婕. 湖南工业大学学报. 2020(01)
[4]一种快速挖掘top-k高效用模式的算法[J]. 吴倩,王林平,罗相洲,崔建群,王海. 计算机应用研究. 2017(11)
[5]基于MapReduce的top-k高效用模式挖掘算法[J]. 吴倩,王林平,罗相洲,崔建群,王海. 计算机应用研究. 2017(10)
[6]基于相似度的自适应异类多种群蚁群算法[J]. 张鹏,薛宏全,原欣伟. 计算机工程与应用. 2014(19)
[7]并行蚁群算法中的自适应交流策略(英文)[J]. 陈崚,章春芳. 软件学报. 2007(03)
[8]基于变异和动态信息素更新的蚁群优化算法[J]. 朱庆保,杨志军. 软件学报. 2004(02)
[9]基于分布均匀度的自适应蚁群算法[J]. 陈崚,沈洁,秦玲,陈宏建. 软件学报. 2003(08)
硕士论文
[1]高效用模式挖掘算法研究及应用[D]. 罗相洲.华中师范大学 2017
[2]基于高效用模式挖掘的推荐方法研究[D]. 吉红蕾.北方工业大学 2014
本文编号:3047938
【文章来源】:北方工业大学北京市
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
蚂蚁系统流程图
第二章问题描述10每个节点都表示特定项集,这个项集可以被蚂蚁评估是否是高效用项集。图2-2是递归构建的蚂蚁路径图。图2-2蚂蚁路径图2.3.2伪随机比例规则HUIM-ACS算法使用当前节点和候选节点组成项集的TWU值作为启发式函数,只计算蚂蚁第一次到达相关节点的TWU值。在伪随机比例规则中当前节点和候选节点组成项集的TWU值有以下三种情况。(1)成对的项目没有任何TWU值信息。(2)处理包含所有成对项目的TWU值。(3)一些没有处理的成对项目的TWU值。2.3.3全局更新规则HUIM-ACS算法简化了传统的全局更新公式,在每次迭代中只是使用项集效用值加强信息素浓度并且忽略挥发参数。且在每次迭代中不总是加强信息浓度,这样避免了蚂蚁路径图中一些区域路径上信息素浓度过大。这样对挖掘高效用项集是有利的,因为需要挖掘出更多的解而不是单一的最优解。2.4本章小结高效用模式挖掘主要是从给定的数据集中挖掘出所有大于指定阈值的项集。AC算法是最早提出的蚂蚁种群优化算法,主要流程是初始化蚂蚁种群,蚂蚁移动完成一次循环后在经过的路径上释放信息素,满足终止条件后算法结束。ACS
第三章基于ACO的高效用模式挖掘算法173.3.2运行时间首先,我们阐述提出的HUIM-ACO算法性能。图3-1展示了每个算法在4个数据上运行时间的对比。我们通过改变每个数据集的最小效用阈值来测量各个算法在4个数据集上的运行时间。图3-14个数据集的运行时间就Accident数据集而言,HUIM-BPSO运行了4天后都没有返回任何结果,因此在图3-1中没有标记出这个算法的任何结果,我们从图3-1中可以看出提出的HUIM-ACO算法比HUIM-BPSO算法和Bio-HUIF-GA算法快出一个量级。就Chess和Connect数据集,HUIM-ACO比Bio-HUIF-PSO快了一个数量级。值得注意的是HUIM-ACO算法运行时间总是很稳定,并且几乎没有受最小效用阈值改变的影响。3.3.3挖掘结果数量因为演化HUIM算法无法确保在一定的循环次数后所有项集的挖掘,我们比对了各个演化算法挖掘的HUIs数量。与3.4.2小结同理,我们没有绘制出在Accident数据集中HUIM-BPSO算法的结果。
【参考文献】:
期刊论文
[1]基于多效用阈值的分布式高效用序列模式挖掘[J]. 曾毅,张福泉. 计算机工程与设计. 2020(02)
[2]基于投影二维表的最大频繁模式挖掘算法[J]. 王利军. 西昌学院学报(自然科学版). 2019(04)
[3]基于Spark平台的FP-Growth算法优化与实现[J]. 黄婕. 湖南工业大学学报. 2020(01)
[4]一种快速挖掘top-k高效用模式的算法[J]. 吴倩,王林平,罗相洲,崔建群,王海. 计算机应用研究. 2017(11)
[5]基于MapReduce的top-k高效用模式挖掘算法[J]. 吴倩,王林平,罗相洲,崔建群,王海. 计算机应用研究. 2017(10)
[6]基于相似度的自适应异类多种群蚁群算法[J]. 张鹏,薛宏全,原欣伟. 计算机工程与应用. 2014(19)
[7]并行蚁群算法中的自适应交流策略(英文)[J]. 陈崚,章春芳. 软件学报. 2007(03)
[8]基于变异和动态信息素更新的蚁群优化算法[J]. 朱庆保,杨志军. 软件学报. 2004(02)
[9]基于分布均匀度的自适应蚁群算法[J]. 陈崚,沈洁,秦玲,陈宏建. 软件学报. 2003(08)
硕士论文
[1]高效用模式挖掘算法研究及应用[D]. 罗相洲.华中师范大学 2017
[2]基于高效用模式挖掘的推荐方法研究[D]. 吉红蕾.北方工业大学 2014
本文编号:3047938
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3047938.html
最近更新
教材专著