当前位置:主页 > 科技论文 > 软件论文 >

基于Nodeset的最大频繁项集挖掘算法

发布时间:2017-12-22 00:09

  本文关键词:基于Nodeset的最大频繁项集挖掘算法 出处:《计算机工程》2016年12期  论文类型:期刊论文


  更多相关文章: 最大频繁项集 关联规则 剪枝技术 前缀树 超集检测


【摘要】:递归遍历、条件FP-Tree构建与超集检测是多数基于FP-Tree最大频繁项集挖掘算法的主要性能瓶颈。为此,提出一种基于Nodeset的最大频繁项集挖掘算法——MFIN算法。该算法采用Nodeset数据结构对POC-Tree的节点编码,将集合枚举树作为搜索空间,避免递归遍历和条件FP-Tree构建的时间开销。设计提前停止方法提高求解Nodeset交集的效率,采用父等价剪枝技术和前瞻剪枝技术缩小搜索空间。对基于MFI-Tree的投影策略进行改进,提升超集检测的速度。实验结果表明,MFIN算法在mushroom,pumsb,webdocs数据集上的运行时间及执行效率等总体性能明显优于基于FP-Tree的FP-Max算法。
【作者单位】: 华东师范大学计算机科学技术系;
【基金】:上海市国际科技合作项目(13430710100) 上海市科委科技创新行动计划项目(13511506201)
【分类号】:TP311.13
【正文快照】: 0概述1993年,Rakesh Agrawal等人[1]提出了关联规则挖掘这一研究课题。作为数据挖掘中的一个重要研究方向,关联规则挖掘已经被普遍应用于分类[2]、数据流时序规则[3]、网络故障检测[4]等。关联规则挖掘一般分为挖掘频繁项集与提取关联规则2个步骤。其中,由于指数级别的搜索空

【相似文献】

中国期刊全文数据库 前10条

1 宋威;杨炳儒;徐章艳;侯伟;;基于索引数组与集合枚举树的最大频繁项集挖掘算法[J];计算机科学;2007年07期

2 陈晨;;最大频繁项集挖掘算法综述[J];电脑知识与技术;2008年32期

3 刘红星;王崇骏;谢俊元;;基于图的最大频繁项集的生成算法[J];南京大学学报(自然科学版);2008年05期

4 陈凯,冯全源;最大频繁项集的高效挖掘[J];微电子学与计算机;2005年08期

5 袁鼎荣;严小卫;;最大频繁项集挖掘算法的分析研究[J];计算机应用与软件;2005年12期

6 颜跃进,李舟军,陈火旺;一种挖掘最大频繁项集的深度优先算法[J];计算机研究与发展;2005年03期

7 颜跃进;李舟军;陈火旺;;多层扩展挖掘最大频繁项集[J];计算机工程与科学;2006年03期

8 胡斌;蒋外文;黄天强;陈生萍;施渊;;一种最大频繁项集快速更新算法[J];计算机应用研究;2006年12期

9 郭有强;胡学钢;;基于项目增长法高效求解最大频繁项集[J];安徽科技学院学报;2006年06期

10 胡斌;蒋外文;蔡国民;黄天强;卓月明;;基于位阵的更新最大频繁项集算法[J];计算机工程;2007年03期

中国重要会议论文全文数据库 前5条

1 杨君锐;赵群礼;杜建;;关于最大频繁项集的增量式挖掘方法研究[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

2 杨仕博;贺彦琨;马志新;;一种基于极大完全子图的最大频繁项集并行挖掘算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年

3 黄红星;钟一文;黄习培;;挖掘最大频繁项集的二进制蚁群优化算法[A];第四届中国智能计算大会论文集[C];2010年

4 王卉;屈强;;挖掘最大频繁项集的并行化策略[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年

5 任家东;霍聪;;数据流中基于PB-tree的当前最大频繁项集挖掘算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年

中国博士学位论文全文数据库 前3条

1 王卉;最大频繁项集挖掘算法及应用研究[D];华中科技大学;2004年

2 颜跃进;最大频繁项集挖掘算法的研究[D];国防科学技术大学;2005年

3 敖富江;数据流频繁模式挖掘关键算法及其仿真应用研究[D];国防科学技术大学;2008年

中国硕士学位论文全文数据库 前10条

1 张进;微博炒作账户特征分析与群体发现技术研究[D];解放军信息工程大学;2014年

2 候明利;不确定数据流最大频繁项集挖掘算法研究[D];安徽大学;2016年

3 张心静;最大频繁项集挖掘算法的研究[D];长春工业大学;2016年

4 罗昌银;一种基于动态排序的最大频繁项集挖掘算法[D];重庆大学;2010年

5 刘华;蚁群算法在挖掘最大频繁项集问题中的应用研究[D];河北工业大学;2007年

6 宋晓辉;基于Web使用挖掘的个性化技术研究[D];燕山大学;2009年

7 韩崇;最大频繁项集和频繁基项集挖掘算法研究[D];河南大学;2010年

8 裴文柱;数据流最大频繁项集挖掘算法的研究[D];东北大学;2009年

9 姜晗;关联规则的精简方法研究[D];浙江师范大学;2007年

10 惠亮;关联规则挖掘算法研究[D];江南大学;2011年



本文编号:1317683

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1317683.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8bdb7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com