当前位置:主页 > 管理论文 > 统计学论文 >

基于信息熵的事务型数据关联规则挖掘研究

发布时间:2021-11-20 22:41
  数据挖掘是大数据时代蓬勃发展的新技术,它通过计算机技术对庞大且复杂的数据库进行数据分析,解决传统统计学无法解决的问题。关联分析是数据挖掘研究中的一个重要分支,又被称作关联规则挖掘。它主要面向的数据类型是事务型数据,用于探寻事物间的关联关系。FP-Growth算法作为关联规则挖掘中的经典算法,通过分而治之的策略发现数据集中各项目间的关联关系。但是,由于其视数据集中各项目“平等一致”的缺陷,会导致挖掘过程中一些重要的关联关系遗漏。因此,加权关联规则挖掘应运而生。然而,现有的加权关联规则算法也存在局限性:没有考虑到数据集系统本身的混乱程度或不确定性。本论文将通过研究事务型数据,提出一种改进的加权关联规则挖掘算法,可有效处理高度混乱的事务型数据集,发现更多潜在或有价值的关联关系。本论文主要包括以下四个方面的内容:第一,从传统统计学以及数据挖掘的角度研究事物间的关联问题,并对事务型数据的类型和特点进行了归纳和总结;第二,对关联分析的相关理论进行了研究和探讨,分析了经典关联算法将数据集中各项目视作“平等一致”的问题,并对现有的一些关联分析算法进行了研究;第三,针对现有加权关联算法不能解决数据集系统... 

【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:76 页

【学位级别】:硕士

【部分图文】:

基于信息熵的事务型数据关联规则挖掘研究


狭义信息论中最简单的通信系统模型

加权关联规则,挖掘模型,广义信息


(2)信道是一种传输媒介,在通信系统模型中,它的主要作用是从发信者出携带信息的信号。信道一般是一些通信设施,包括发信和守信在内等设备论中,信道一般指电线、电缆、光纤、磁盘等;在广义信息论中,信道是任信息的媒介。(3)信宿是消息抵达的目的地,即收信者处,通常是接收信息的对象,可以是机器。(4)噪声是指分布在信道以及通信系统模型中其他部分的所有噪声的统描述对信道输出造成的干扰。二)广义信息论的模型推广广义信息论除了包括狭义信息论的所有内容之外,还包括与信息研究有关及研究领域。根据广义信息论的相关理论,本研究构造一个加权关联规则挖统模型,如图 2-2 所示:信息熵模型完整的关加权关联加权

基于信息熵的事务型数据关联规则挖掘研究


构造FP-TreeK:1L:2

【参考文献】:
期刊论文
[1]基于矩阵压缩的加权关联规则挖掘算法[J]. 肖红光,邓国群,谭雯,向德华,李宁.  测控技术. 2018(03)
[2]基于大数据的关联规则Apriori算法的研究与改进[J]. 王倬,李丹.  图书情报工作. 2016(S2)
[3]大数据关联关系度量研究综述[J]. 钱宇华,成红红,梁新彦,王建新.  数据采集与处理. 2015(06)
[4]基于项权值变化的完全加权正负关联规则挖掘[J]. 周秀梅,黄名选.  电子学报. 2015(08)
[5]FP-Growth的并行加权关联规则挖掘算法[J]. 李翔,刘韶涛.  华侨大学学报(自然科学版). 2014(05)
[6]基于布尔矩阵的高价值度关联规则挖掘算法[J]. 叶世绮,孙振,赵喆.  科技管理研究. 2014(06)
[7]一种基于向量的概率加权关联规则挖掘算法[J]. 赵志刚,万军,王芳.  计算机工程与科学. 2014(02)
[8]大数据时代统计学面临的机遇与挑战[J]. 耿直.  统计研究. 2014(01)
[9]一种多最小支持度加权关联规则挖掘算法[J]. 张争龙,李星毅.  科学技术与工程. 2013(19)
[10]基于时序和兴趣度约束的加权关联规则挖掘算法研究[J]. 杨泽民.  计算机科学. 2013(03)



本文编号:3508221

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3508221.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4e154***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com