当前位置:主页 > 科技论文 > 软件论文 >

数据挖掘中关联规则算法的研究

发布时间:2021-12-10 15:06
  关联规则挖掘是数据挖掘中热门的研究方向之一。随着数据规模的爆炸式增长,传统的关联规则挖掘算法时间效率过低,如何提高算法的时间效率是关联规则挖掘的主要研究内容。本文从二元属性和多值属性两个方面展开对关联规则算法的研究。一方面,本文深入研究了基于二元属性的布尔关联规则算法Apriori算法,针对其候选项集规模庞大、计数过程较慢的缺点提出了一种基于Hash树的并行计数改进算法,算法从三个方面改进,第一,对频繁项集进行裁剪,降低连接产生的候选项集的规模;第二,使用Hash树存储候选1项集,加快支持度计数过程,从候选2项集开始,利用事务和项集已按字典序升序排列的特点,改进Apriori算法的计数过程;第三,充分利用多核CPU的优势,使用多线程技术改写计数过程实现并行计数。通过实验对Apriori算法和改进算法进行性能测试,结果表明,改进算法的时间性能大大提升。另一方面,本文深入研究Apriori算法处理多值属性数据集的过程,指出其处理过程中产生的无效项目集过多的问题,针对该问题,提出一种减少无效项目集数目的优化算法,该算法剔除了同一属性不同属性值连接产生的项集,从而降低了候选项集的规模。实验结果... 

【文章来源】:江苏科技大学江苏省

【文章页数】:66 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题研究背景
    1.2 课题研究现状
        1.2.1 数据挖掘研究现状
        1.2.2 关联规则研究现状
        1.2.3 未来发展趋势
    1.3 本文主要工作
    1.4 论文组织结构
第2章 关联规则相关理论
    2.1 数据挖掘简介
        2.1.1 数据挖掘基本概念
        2.1.2 数据挖掘过程
        2.1.3 数据挖掘常用方法和技术
    2.2 关联规则理论基础
        2.2.1 关联规则相关定义
        2.2.2 关联规则定理及性质
    2.3 关联规则挖掘过程
    2.4 本章小结
第3章 基于二元属性的关联规则挖掘算法
    3.1 经典关联规则算法Apriori
        3.1.1 算法描述
        3.1.2 算法实例
        3.1.3 算法评价
        3.1.4 Apriori算法的几种改进方法
    3.2 基于Hash树的并行计数改进算法
        3.2.1 算法思想
        3.2.2 算法描述
        3.2.3 实例分析
        3.2.4 算法性能评价
    3.3 本章小结
第4章 基于多值属性的关联规则挖掘算法
    4.1 多值属性关联规则概述
        4.1.1 多值属性关联规则相关概念
        4.1.2 多值属性关联规则挖掘步骤
    4.2 多值属性数据处理
        4.2.1 多值属性数据的特点分析
        4.2.2 分类属性的处理
        4.2.3 数值属性的处理
    4.3 基于多值属性的Apriori优化算法
        4.3.1 算法描述
        4.3.2 实例分析
        4.3.3 性能对比
    4.4 本章小结
第5章 结论与展望
    5.1 论文总结
    5.2 工作展望
参考文献
攻读硕士学位期间发表的论文及参与的科研项目
致谢
中文详细摘要


【参考文献】:
期刊论文
[1]基于关联规则挖掘Apriori算法的改进算法[J]. 周凯,顾洪博,李爱国.  陕西理工大学学报(自然科学版). 2018(05)
[2]一种基于多值属性的改进Apriori算法[J]. 赵龙,杨小兵,吴强,高宇.  中国计量大学学报. 2017(01)
[3]一种基于矩阵和权重改进的Apriori算法[J]. 边根庆,王月.  微电子学与计算机. 2017(01)
[4]一种基于Apriori算法的优化挖掘算法[J]. 陈志飞,冯钧.  计算机与现代化. 2016(09)
[5]关联规则挖掘Apriori算法的一种改进[J]. 屈鑫乙,王迪,刘滏.  中国市场. 2016(36)
[6]多值属性关联规则挖掘的Q-Apriori算法[J]. 姜丽莉,孟凡荣,周勇.  计算机工程. 2011(09)
[7]蚁群算法在网页内容分类中的应用研究[J]. 韩杰,王自强,李春峰,谭明交.  计算机系统应用. 2009(04)
[8]一种基于事务压缩的关联规则优化算法[J]. 张素兰.  计算机工程与设计. 2006(18)
[9]一种基于关系矩阵的关联规则快速挖掘算法[J]. 胡慧蓉,王周敬.  计算机应用. 2005(07)
[10]基于向量和矩阵的挖掘关联规则的高效算法[J]. 牛小飞,石冰.  计算机工程与应用. 2004(12)

硕士论文
[1]数据挖掘关联规则算法研究与应用[D]. 滕子牧.辽宁科技大学 2015
[2]基于关联规则的数据挖掘算法研究[D]. 孙迪.电子科技大学 2010
[3]数据挖掘技术中关联规则算法的研究[D]. 孔芳.江南大学 2008
[4]基于关联规则的数据挖掘算法研究[D]. 吴海玲.河海大学 2007
[5]数据挖掘中关联规则算法的研究[D]. 钱冬云.天津大学 2006



本文编号:3532859

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3532859.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户28c7f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com