当前位置:主页 > 科技论文 > 软件论文 >

含正负项目的FP-Growth算法及其在日志分析中的应用研究

发布时间:2021-05-10 15:38
  关联规则挖掘是数据挖掘中重要研究的方法之一,其目的是从大型数据库中发现有用的信息。人们利用数据挖掘技术从数据中获得了很多有用的信息,这些信息推动着人类科技的发展。但是,海量的数据是人们进行数据挖掘所面临的一大难题,如果没有高效率的挖掘算法,人们在进行数据挖掘时所耗费的时间将是巨大的。而且目前所研究的大多数数据挖掘都只是挖掘事务之间的正向关系,而往往忽略了事务间负关联关系的存在。但是在现实生活中的很多领域,单单对正关联规则进行挖掘是远远不够的,还需要考虑到所挖掘数据之间的负关联关系,从而提高关联规则的描述力。本文针对以上问题,对以下三点展开了研究:(1)研究了包含事务数据库中正项目和负项目的FP-Growth算法考虑到在引入负项目之后,就会使原有的数据量倍增,从而导致项集的数目过大,所构造的FP-tree的分支的长度也就会过长,FP-tree的空间占有率也会过大,挖掘效率也会随之降低。为解决这一问题,本文对FP-tree的构造方法进行了改进,即利用动态插入节点的方法构造FP-tree,而且将所有的指针倒转,从而生成一个新型的FP-tree,从而减低FP-tree的生成成本。本文还提出了一... 

【文章来源】:山东师范大学山东省

【文章页数】:42 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外的研究现状
        1.2.1 FP-Growth算法的相关研究
        1.2.2 关联规则挖掘方法的相关研究
    1.3 本文的主要研究工作
    1.4 本文的组织结构
    1.5 本章小结
第二章 关联规则的相关理论
    2.1 关联规则的概述
        2.1.1 关联规则基本概念
        2.1.2 关联规则度量
        2.1.3 关联规则的挖掘步骤
        2.1.4 关联规则挖掘的研究方向
    2.2 关联规则的挖掘算法
    2.3 本章小结
第三章 包含正负项目的FP-Growth算法
    3.1 FP-Growth算法
        3.1.1 FP-Growth算法的基本概念
        3.1.2 FP-Growth算法的算法描述
    3.2 含正负项目关联规则的描述
    3.3 改进的FP-Growth算法
        3.3.1 问题的提出
        3.3.2 算法的改进思路
        3.3.3 算法的描述
        3.3.4 举例说明
    3.4 实验及结果分析
    3.5 本章小结
第四章 基于多重最小支持度的FP-Growth算法改进
    4.1 问题的提出
    4.2 多重最小支持度的引入
    4.3 基于多重最小支持度的挖掘算法
    4.4 算法实验与比较
    4.5 本章小结
第五章 改进的FP-Growth算法在日志分析中的应用
    5.1 系统设计
    5.2 系统实现
        5.2.1 客户端
        5.2.2 服务器端
    5.3 本章小结
第六章 总结与展望
    6.1 工作总结
    6.2 工作展望
参考文献
攻读硕士学位期间的主要成果
致谢


【参考文献】:
期刊论文
[1]第41次《中国互联网络发展状况统计报告》发布[J].   中国广播. 2018(03)
[2]基于改进的FP-tree最大频繁模式挖掘算法[J]. 宁慧,王素红,崔立刚,郭笑语,徐丽.  应用科技. 2016(02)
[3]改进的基于频繁模式树的最大频繁项集挖掘算法——FP-MFIA[J]. 杨鹏坤,彭慧,周晓锋,孙玉庆.  计算机应用. 2015(03)
[4]基于改进FP-Tree的最大频繁项集高效挖掘算法[J]. 纪怀猛.  计算机与数字工程. 2014(06)
[5]基于FPMAX的最大频繁项目集挖掘改进算法[J]. 牛新征,佘堃.  计算机科学. 2013(12)
[6]一种挖掘负关联规则的有效方法[J]. 张雅芬,王新.  云南民族大学学报(自然科学版). 2011(04)
[7]一种基于用户行为的兴趣度模型[J]. 王微微,夏秀峰,李晓明.  计算机工程与应用. 2012(08)
[8]基于改进的FP-tree的频繁模式挖掘算法[J]. 李也白,唐辉,张淳,贺玉明.  计算机应用. 2011(01)
[9]关联规则中改进FP-tree的最大频繁模式挖掘算法[J]. 钱雪忠,惠亮.  计算机工程与设计. 2010(21)
[10]多最小支持度关联规则挖掘研究[J]. 常浩,陈莉.  微计算机信息. 2010(24)

博士论文
[1]关联规则优化方法的研究[D]. 贺志.北京交通大学 2007

硕士论文
[1]基于AFOPT-tree的最大频繁项集挖掘[D]. 王浩.安徽大学 2014
[2]基于正负项目及多支持度的关联规则挖掘算法研究[D]. 李彦钊.西南交通大学 2010
[3]关联规则算法及度量方法研究[D]. 周秀芬.南京理工大学 2008
[4]多最小支持度下的关联规则研究[D]. 王瑄.长春理工大学 2008
[5]关联规则挖掘算法的分析、优化及应用[D]. 刘芝怡.苏州大学 2007
[6]数据挖掘中关联规则算法的研究[D]. 钱冬云.天津大学 2006
[7]基于FP-树的关联规则挖掘算法的设计与实现[D]. 刘乃丽.山东大学 2005
[8]基于FP-树的最大频繁模式挖掘算法研究[D]. 冯志新.广西大学 2003



本文编号:3179617

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3179617.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fb83c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com