当前位置:主页 > 科技论文 > 软件论文 >

基于利润约束的频繁项集挖掘算法研究

发布时间:2024-10-05 03:37
  随着数据库技术和计算机技术的不断发展,其应用范围越来越广泛。在企业资源管理系统中产生海量的与企业管理与日常运营相关的数据。其规模已远超过人类可以直接处理的范畴。如何处理大量的数据并发现数据中蕴含的对企业运营与发展有益的信息成为企业面临的问题之一。在此背景下,数据挖掘营运而生。关联挖掘是数据挖掘的重要分支,其目的是从大批量的数据中挖掘出项之间的关联和满足特定条件的模式。自关联规则挖掘的概念提出至今,该技术不断地发展成熟。关联规则经典算法Apriori算法也引起了众多的研究和改进,并得到广泛应用。商品的利润是企业运营中关注的重要指标,用户对具有高利润的关联模式具有更高的兴趣。而传统的关联规则挖掘算法改进算法多是基于布尔类型的挖掘算法,其主要关注项的发生频率,没有考虑到商品的具体利润以及在每个事务中的销售数量。一方面,基于支持度框架的关联挖掘会挖掘出大量的关联规则,用户很难从中发现对实际行动具有指导意义的关联。另外一个方面,基于支持度框架的关联挖掘算法挖掘出的关联并不一定是用户感兴趣的高利润关联规则。文中经过对基于利润的项集特点进行分析,阐述了Apriori的支持度约束对于基于利润的频繁项集挖...

【文章页数】:77 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 本文研究背景
    1.2 研究现状
    1.3 本文主要研究内容
    1.4 本文的贡献
    1.5 本文组织结构
第二章 关联规则的定义和算法
    2.1 关联规则挖掘概述
    2.2 关联规则的基本概念
    2.3 关联规则算法APRIORI及其特点
        2.3.1 APRIORI算法
        2.3.2 APRIORI算法的特点
    2.4 提高关联规则算法效率
    2.5 本章小结
第三章 基于利润的频繁项集挖掘算法设计
    3.1 基于利润的频繁项集挖掘定义
        3.1.1 与利润相关的基本概念
        3.1.2 APRIORI对于基于利润约束的项集挖掘不足与改进
        3.1.3 进一步提高频繁项集的质量
        3.1.4 基于利润的关联规则挖掘的任务描述
    3.2 基于利润的频繁项集挖掘算法设计
        3.2.1 数据预处理
        3.2.2 基于利润约束的频繁项集挖掘算法
    3.3 算法并行设计
    3.4 本章小结
第四章 基于利润的频繁项集挖掘算法实现
    4.1 算法的流程设计
    4.2 数据预处理
        4.2.1 数据结构
        4.2.2 数据转换
    4.3 挖掘频繁项集
        4.3.1 数据结构设计
        4.3.2 算法的并行实现
        4.3.3 对比算法
    4.4 频繁项集的评估
        4.4.1 数据结构设计
        4.4.2 生成有效频繁项集
    4.5 结果展示方式
    4.6 本章小结
第五章 挖掘实验及结果分析
    5.1 实验数据获取及数据介绍
        5.1.1 合成实验数据
        5.1.2 网上商店销售数据
    5.2 实验环境及实验方法
    5.3 基于合成数据集据挖掘实验及结果分析
        5.3.1 实验分组及参数设定
        5.3.2 挖掘结果分析
    5.4 基于网上商店销售数据挖掘实验及结果分析
        5.4.1 实验分组及参数设定
        5.4.2 挖掘结果分析
    5.5 算法运行效率实验
    5.6 本章小结
第六章 总结和展望
    6.1 论文总结
    6.2 未来展望
参考文献
致谢
攻读学位期间发表的学术论文



本文编号:4007494

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/4007494.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f4f5f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com