大数据分析中相关规则的挖掘和提升
发布时间:2020-08-09 08:34
【摘要】:本文在大数据决策的背景下,建立了基于相关性的决策模型,定义了相关决策系统,设计出构造相关决策计数表的算法,为后面的模型决策提供了数据平台。从数据挖掘的基本算法出发,将关联规则挖掘算法进行了改进,定义了相关规则的概念,并构造了适用于商品推荐系统单个商品推荐和多个商品推荐的两大基本算法,进而根据生成的相关规则做出预测和决策,为特定行业的相关决策提供理论依据。本文通过实验对相关规则挖掘算法进行了验证,并与传统的关联规则挖掘Apriori方法在算法复杂度、准确率、实用性以及可推广性等方面进行了对比,初步证明了相关规则的有效性。为了进一步推广相关规则算法,从超市管理者的角度出发,建立商品类与类之间的相关模型,构造相关规则提升算法用以研究商品大类之间的相关性,最终得出结论并应用于超市管理中,为超市的管理决策提供指导。本文提出的理论与方法可以通过与其他领域结合深入研究,获得更广泛的推广应用。
【学位授予单位】:华北电力大学(北京)
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:C81
【图文】:
这里用相关度来代替支持度和置信度的做法是参考文献_中提出的新想法。逡逑在该文献中,通过实验证明了当K足够大时,可以过滤掉较低的支持度的规则,逡逑直接选取相关度最高的规则作为相关推荐(见图3-1)。图中的每个点分别代表着逡逑一条规则,横坐标代表着规则按置信度由高到低的顺序进行排列,纵坐标代表着逡逑每条规则对应的支持度的取值,图3-1中可以看出,在K=0时,相关度等于置逡逑信度,排在前面的规则的支持度有大有小,这些并不是想得到的相关度较高的规逡逑则。在K>10时,支持度很小的规则被过滤掉了邋一部分。随着K的再次加大,当逡逑K=50时,可以清晰的看到排在最靠前的规则的支持度都超过了邋0.5,这些规则既逡逑满足高的置信度又满足高的支持度。可以看出,随着K的不断增加,通过相关逡逑度的单一指标筛选即可得到既满足高支持度又满足高置信度的规则。逡逑14逡逑
S?(更S*货架邋j逡逑图4-1超市商品管理的不同角度逡逑如图4-1在研究超市商品管理问题时有两种角度M,一种是从销售人员和逡逑一般管理人员的角度来看,他们的工作是关于商品销售、商品退化货、增删货逡逑架以及促销等方面,他们更关注的是商品小的分类之间的密切联系。另一种角逡逑度是从超市高级管理人员的视角出发,针对货物的库存安排、整体销售以及统逡逑计货架等方面指导,分析商品大类之间相关性,做出商场的整体安排与决策。逡逑在本章中从超市高级管理人员的角度出发,把原始的购物记录数据根据大逡逑类进行合并,从相关规则概念出发,借助聚类算法1361的思想构造相关规则的提逡逑26逡逑
图4-3商品的大类分类逡逑根据商品大类之间相关性的定义,得到类与类之间的相关决策计数表。这逡逑里只需计算关于两个类之间的相关性,得到15x15的相关矩阵见图4-4,分别逡逑代表着每一类与其他14类之间的相关度fk的值,这里的k值参考前面相关规则逡逑的挖掘的选定为50。逡逑29逡逑
本文编号:2786875
【学位授予单位】:华北电力大学(北京)
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:C81
【图文】:
这里用相关度来代替支持度和置信度的做法是参考文献_中提出的新想法。逡逑在该文献中,通过实验证明了当K足够大时,可以过滤掉较低的支持度的规则,逡逑直接选取相关度最高的规则作为相关推荐(见图3-1)。图中的每个点分别代表着逡逑一条规则,横坐标代表着规则按置信度由高到低的顺序进行排列,纵坐标代表着逡逑每条规则对应的支持度的取值,图3-1中可以看出,在K=0时,相关度等于置逡逑信度,排在前面的规则的支持度有大有小,这些并不是想得到的相关度较高的规逡逑则。在K>10时,支持度很小的规则被过滤掉了邋一部分。随着K的再次加大,当逡逑K=50时,可以清晰的看到排在最靠前的规则的支持度都超过了邋0.5,这些规则既逡逑满足高的置信度又满足高的支持度。可以看出,随着K的不断增加,通过相关逡逑度的单一指标筛选即可得到既满足高支持度又满足高置信度的规则。逡逑14逡逑
S?(更S*货架邋j逡逑图4-1超市商品管理的不同角度逡逑如图4-1在研究超市商品管理问题时有两种角度M,一种是从销售人员和逡逑一般管理人员的角度来看,他们的工作是关于商品销售、商品退化货、增删货逡逑架以及促销等方面,他们更关注的是商品小的分类之间的密切联系。另一种角逡逑度是从超市高级管理人员的视角出发,针对货物的库存安排、整体销售以及统逡逑计货架等方面指导,分析商品大类之间相关性,做出商场的整体安排与决策。逡逑在本章中从超市高级管理人员的角度出发,把原始的购物记录数据根据大逡逑类进行合并,从相关规则概念出发,借助聚类算法1361的思想构造相关规则的提逡逑26逡逑
图4-3商品的大类分类逡逑根据商品大类之间相关性的定义,得到类与类之间的相关决策计数表。这逡逑里只需计算关于两个类之间的相关性,得到15x15的相关矩阵见图4-4,分别逡逑代表着每一类与其他14类之间的相关度fk的值,这里的k值参考前面相关规则逡逑的挖掘的选定为50。逡逑29逡逑
【参考文献】
相关期刊论文 前8条
1 梁吉业;钱宇华;李德玉;胡清华;;大数据挖掘的粒计算理论与方法[J];中国科学:信息科学;2015年11期
2 杨静;李文平;张健沛;;大数据典型相关分析的云模型方法[J];通信学报;2013年10期
3 甘振韬;梅文;郭玉军;;数据挖掘技术在网络课程资源配置中的研究[J];中国医学教育技术;2012年06期
4 刘志勇;;关联规则数据挖掘在图书馆藏书建设中的应用研究[J];电子设计工程;2011年21期
5 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
6 佟强,周园春,阎保平;关联规则挖掘算法[J];微电子学与计算机;2005年06期
7 毕建欣,张岐山;关联规则挖掘算法综述[J];中国工程科学;2005年04期
8 罗祥林;集合子集求法初探[J];楚雄师专学报;1995年03期
本文编号:2786875
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2786875.html