当前位置:主页 > 科技论文 > 数学论文 >

基于贝叶斯估计与分布的关联分析方法研究

发布时间:2018-05-23 18:48

  本文选题:尺度关联规则 + 贝叶斯估计 ; 参考:《华南理工大学》2016年硕士论文


【摘要】:关联规则挖掘侧重于发现数据中不同项集之间的关联关系。传统的关联规则挖掘算法以多次扫描数据库来挖掘频繁项目集以提取关联规则,当数据达到一定量级时,存在效率不高、运算量大等问题。本文针对该问题,依据贝叶斯估计理论,提出一种基于项集变量分布与参数贝叶斯估计的计算项集支持度和规则可信度的关联分析方法,使挖掘关联规则尽可能减少数据库扫描次数并使新增数据的规则更新更简单。主要研究内容如下:(1)定义项变量为随机变量,假设变量之间相互独立且均服从正态分布,通过分布参数的贝叶斯估计值,确定每一个项变量的分布函数。给出基于分布的关联分析条件下的项集支持度和规则置信度的新定义。(2)提出基于项变量分布与分布参数贝叶斯估计的关联更新算法。结合贝叶斯共轭先验分布理论,将原样本分布看成先验分布,新增数据看成样本分布,得到参数的后验分布和贝叶斯估计值,从而对项目变量的分布函数进行动态更新。通过动态更新的参数后验分布,计算相应项集事件出现的支持度和提取规则的可信度,特别地,关联规则的更新只需依赖更新后的后验分布函数计算的项集支持度与规则可信度即可。通过与经典Apriori算法进行比较,论证了增加的新数据下,分布的关联规则算法的可行性和高效性。(3)经典的关联分析/分类规则,只表示A发生导致B发生的规则可能性,没有A发生量多少导致B发生量多少的规则可能性,基于项变量分布与贝叶斯估计的关联规则,可以弥补这一缺陷,即针对每一个项目随机变量,可以通过选择不同实数c的变化,根据动态后验分布函数计算k_项集取值不小于c的概率,得到任意k_项集的带有发生量大小的支持度,从而挖掘出带有动态尺度c的关联规则,拓展了经典关联分析方法提取规则的应用面。
[Abstract]:Association rule mining focuses on discovering the association relationship between different itemsets in data. The traditional association rule mining algorithm mine frequent itemsets by scanning the database many times to extract association rules. When the data reaches a certain order of magnitude, there are some problems such as low efficiency and large computation. In this paper, according to Bayesian estimation theory, an association analysis method based on Bayesian estimation of itemset variable distribution and parameter Bayesian estimation is proposed. Mining association rules reduce the number of database scans as much as possible and make it easier to update new data rules. The main contents of this study are as follows: (1) define the term variables as random variables and assume that each variable is independent and obeyed the normal distribution. The distribution function of each item variable is determined by Bayesian estimation of the distribution parameters. A new definition of itemset support and rule confidence under the condition of distribution-based association analysis is given. A new association updating algorithm based on the distribution of item variables and Bayesian estimation of distributed parameters is proposed. Based on Bayesian conjugate prior distribution theory, the original sample distribution is regarded as a prior distribution, the new data is regarded as a sample distribution, the posterior distribution of parameters and Bayesian estimation are obtained, and the distribution function of item variables is dynamically updated. By dynamically updating the parameter posteriori distribution, the support degree of the event occurrence and the reliability of the extraction rules are calculated, in particular, The updating of association rules only depends on the itemset support and rule confidence calculated by the updated posterior distribution function. By comparing with the classical Apriori algorithm, the feasibility of the distributed association rule algorithm and the efficiency of the classical association analysis / classification rule under the new data are demonstrated. There is no rule possibility of how much A happens and how much B occurs. The association rules based on the distribution of item variables and Bayesian estimation can make up for this shortcoming, that is, random variables for each item. By selecting the variation of different real numbers c, we can calculate the probability that the value of kitem set is not less than c according to the dynamic posteriori distribution function, and obtain the support degree with the amount of occurrence of any kitem set. Thus the association rules with dynamic scale c are excavated and the application of classical association analysis methods is extended.
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O212.8

【相似文献】

相关期刊论文 前10条

1 韦程东,王成名,王炜火斤;相依样本时的线性经验贝叶斯估计[J];广西师范大学学报(自然科学版);2004年01期

2 王志忠,宋允全;非线形模型方差的贝叶斯估计(英文)[J];云南大学学报(自然科学版);2005年04期

3 于忠义;;谁开创了贝叶斯学派?——对拉普拉斯1774年一篇文章的回顾[J];统计与信息论坛;2008年01期

4 徐宝;;寿命产品可靠度的贝叶斯估计[J];统计与决策;2011年04期

5 程子红;;加速寿命试验下参数的贝叶斯估计[J];江西科学;2012年01期

6 宁永成;侯代文;;递推的贝叶斯估计方法[J];四川兵工学报;2013年10期

7 蒋光震;乘客分布矩阵的贝叶斯估计[J];系统工程;1986年05期

8 Rane L.Curl;王仁铎;;同位素年龄差的贝叶斯估计[J];地质科学译丛;1989年03期

9 周锡年;;关于贝叶斯估计[J];杭州教育学院学报;1992年02期

10 杨元喜;抗差贝叶斯估计及应用[J];测绘学报;1992年01期

相关硕士学位论文 前10条

1 王韬;基于贝叶斯网络的###动车组牵引传动系统可靠性分析[D];西南交通大学;2015年

2 杨帆;广义Logistic模型的贝叶斯参数估计[D];吉林大学;2016年

3 黄琴;基于贝叶斯估计与分布的关联分析方法研究[D];华南理工大学;2016年

4 周凯;基于贝叶斯压缩感知的人脸识别研究[D];广西大学;2016年

5 李小华;结构参数识别的贝叶斯估计方法及应用研究[D];中国地震局工程力学研究所;2009年

6 章欣已;基于贝叶斯估计多品种小批量生产的统计过程控制研究[D];上海交通大学;2013年

7 张玉洁;基于评分的贝叶斯网融合方法[D];云南大学;2011年

8 王朝禄;基于贝叶斯网的广告点击率预测方法及实现[D];云南大学;2013年

9 唐思思;基于离散动态贝叶斯网络的信息安全风险评估方法的研究[D];东北大学;2013年

10 朱家明;带有单侧区间信息的正态均值的贝叶斯估计[D];华东师范大学;2002年



本文编号:1925903

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/1925903.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cf8d5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com