当前位置:主页 > 科技论文 > 自动化论文 >

基于1-阶增广树研究构造K-阶贝叶斯因果森林模型

发布时间:2020-07-30 07:52
【摘要】:如果说十九世纪是工业化革命的时代,二十世纪是资本主义战争的时代,那么二十一世纪就是当之无愧的信息技术的时代。随着计算机、互联网等相关技术的迅猛发展,信息技术已经走进人们社会生活的各行各业,信息数据的爆炸式增长更是给各行各业的未来带来了巨大的机遇和挑战。庞大又无序的数据中总是蕴藏着许多未知的,有潜在价值的信息,因此大数据的处理和应用吸引了大批计算机领域专家学者的研究,数据挖掘技术也自然而然地成为了最近十年信息科学技术领域研究的热门问题、难点问题。由于利用了图结构的表示方法能够更加直观、清晰地表达出属性变量之间的依赖关系,基于信息论和概率论的贝叶斯网络算法在众多的数据挖掘算法中脱颖而出。贝叶斯网络被视为概率因果模型的一种,它在处理不确定性和不完整性的问题上有突出表现。最早被提出的基于贝叶斯网络的分类模型是朴素贝叶斯(Naive Bayes,简称NB),它具有严格的属性独立性限定,是目前为止结构最精简的也是限定最严格的贝叶斯分类算法。在NB算法的基础上,随着对相关属性间独立性假设不同程度地放松,产生了一批新的贝叶斯分类算法。目前得到广泛认可的贝叶斯分类算法有TAN、AODE和KDB等。其中TAN模型允许属性之间一阶依赖表达,AODE拥有多模型结构,KDB模型允许属性之间的高阶依赖表达。无论是允许属性的一阶依赖表达、多模型结构、还是允许属性之间高阶依赖表达的分类算法,如何能最大程度地包含最正确的属性之间的依赖关系成为了提高贝叶斯分类算法分类准确度的关键。本文提出了一种新的贝叶斯网络分类算法,K-Dependence Causal Forest(简称KCF),它将最大支撑树扩展成允许属性之间高阶依赖表达的森林,意在能够尽可能地表达出相关属性变量间最重要的依赖关系。KCF综合了上述三种算法TAN、AODE,KDB的特点,其主要思想如下:首先,KCF模型的构建是基于属性之间条件互信息的最大支撑树(简称MST)。接着,MST中每个属性依次充当根节点,由根节点起自顶向下提供属性之间的依赖关系,此时产生的子模型数与属性个数相等,且每个子模型都是一个一阶依赖的TAN模型。最后,允许各个子模型中的每个非根属性在其自身到根节点的路径中选择k-1个节点作为其父节点。为了验证KCF算法的分类效果,本文做了大量的对比实验。实验选用了来自UCI数据库中的40组数据集进行了多个算法之间的对比实验,并且分别从0-1 Loss、Bias和Variance三个参数的角度来分析,验证了KCF算法的分类准确性和稳定性。最后又通过具体数据集对KCF模型的结构进行了详细分析,从Markov blanket角度证明了KCF算法能够更好地对属性之间的依赖关系进行表达,解释了为何KCF算法拥有比较优秀的分类性能。由于KCF的多模型结构公平地对待了每一个相关属性,能够有针对性地进行属性依赖分析这一特点,使其更加适用于医疗领域中的疾病诊断与治疗。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP18

【相似文献】

相关期刊论文 前10条

1 石国桢;;工程诊断和诊断中的贝叶斯方法[J];机械强度;1984年02期

2 陈英武;高妍方;;贝叶斯网络扩展研究综述[J];控制与决策;2008年10期

3 徐立;;预案分析的贝叶斯网络方法[J];价值工程;2012年08期

4 胡春玲;;贝叶斯网络研究综述[J];合肥学院学报(自然科学版);2013年01期

5 楼宇希;;应用贝叶斯方法缩短可靠性试验时间[J];现代雷达;1986年01期

6 郑骏;随机方法与贝叶斯方法在高新技术中的应用[J];软科学;1995年01期

7 覃秋梅;张师超;;一类贝叶斯网络的线性推理[J];计算机科学;1999年10期

8 张琨,徐永红,王珩,刘凤玉;用于入侵检测的贝叶斯网络[J];小型微型计算机系统;2003年05期

9 陈晓怀,程真英,刘春山;动态测量误差的贝叶斯建模预报[J];仪器仪表学报;2004年S1期

10 李芸;;基于贝叶斯信念网络的数据分类挖掘算法[J];计算机科学;2006年09期

相关会议论文 前10条

1 David Z.D'Argenio;;贝叶斯方法在实验室研究向临床的转化以及辨识隐含亚群体中的应用(英文)[A];中国药理学会临床药理学专业委员会会议暨第十次全国临床药理学学术会议论文集[C];2007年

2 姜峰;高文;姚鸿勋;;贝叶斯网络的推理和学习[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年

3 丁东洋;刘希阳;;风险分析中的稳健贝叶斯方法[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年

4 周桃庚;沙定国;;贝叶斯可靠性序贯验证试验方法[A];中国仪器仪表学会第三届青年学术会议论文集(下)[C];2001年

5 陈晓怀;程真英;刘春山;;动态测量误差的贝叶斯建模预报[A];第二届全国信息获取与处理学术会议论文集[C];2004年

6 杜鹏英;罗小平;何志明;;贝叶斯网络的发展及理论应用[A];第三届全国虚拟仪器大会论文集[C];2008年

7 杨丽;武海滨;李康;;无金标准诊断试验评价的贝叶斯方法及应用[A];2011年中国卫生统计学年会会议论文集[C];2011年

8 宁鹏达;;贝叶斯方法在风险投资项目决策中的应用[A];第四届中国科学学与科技政策研究会学术年会论文集(Ⅰ)[C];2008年

9 朱永生;;贝叶斯方法确定泊松变量的置信上限[A];中国物理学会高能物理分会第七届学术年会实验分会场论文集[C];2006年

10 王增忠;柳玉杰;施建刚;;建筑工程项目全寿命安全管理决策的贝叶斯方法[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年

相关博士学位论文 前10条

1 翟胜;基于贝叶斯网络的复杂系统可靠分析方法研究与应用[D];天津工业大学;2016年

2 刘瑞;基于贝叶斯网络的洪水灾害风险评估与建模研究[D];华东师范大学;2016年

3 张润梅;基于贝叶斯网络的复杂系统因果关系研究[D];合肥工业大学;2015年

4 李艳颖;贝叶斯网络学习及数据分类研究[D];西安电子科技大学;2015年

5 赵建U

本文编号:2775247


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2775247.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8ad8a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com