当前位置:主页 > 科技论文 > 自动化论文 >

基于多模型混合的贝叶斯网络结构的研究与改进

发布时间:2017-05-11 15:02

  本文关键词:基于多模型混合的贝叶斯网络结构的研究与改进,,由笔耕文化传播整理发布。


【摘要】:一直以来,分类问题是数据挖掘和机器学习两个领域中的所共有的重要的研究领域,很多学者在分类问题上投入了大量的精力,解决分类问题意义重大,因为这类问题在我们的工作和生活中非常熟悉。基于贝叶斯网络的分类方法成为解决这类问题的最好方法之一,像垃圾邮件过滤(Spam Detection)、产品推荐(Product Recommendation)、文本分类(Text Categorization)等分类问题,贝叶斯分类器都可以轻松应对这类问题。贝叶斯分类器以概率论和信息论为基础,它能够很好的处理缺失数据,而且有很高的分类精度。贝叶斯分类器中最为学者所熟悉的就是朴素贝叶斯分类器,结构简单的朴素贝叶斯分类器,虽然是以忽略数据属性之间的依赖关系的事实为假设,但在一些情况下,其分类精度仍然超越其他成熟的算法,尽管如此,并且朴素贝爷斯分类器得到人们的重视,朴素贝叶斯分类器已经应用到很多领域中用以解决分类问题,而且分类效果不错,但是随着应用的范围越来越广,这种忽略属性间的依赖关系的分类器还是在分类效果上的表现不是很好,不能解决很多数据分类问题。为了弥补朴素贝叶斯分类器由于过多的依赖数值型属性之间相互独立的假设而带来的不足问题,目前提出了很多改进的算法,这些改进的算法主要可以归为三类,属性选择、结构扩展、局部学习。除了上述三种方法外,还有数据集实例加权、属性加权、多模型组合学习等方法。其中多模型组合学习方法目前的研究成果较少,本文正是通过对一些已经成熟的贝叶斯分类算法进行分析、研究、整合,提出一个全新的分类算法。本文提出了一种改进的贝叶斯网络分类器,称为“隐藏-平均一依赖分类器”,简称H-AODE。H-AODE算法是基于AODE和HNB两种分类器,它首先为每个属性结点都学习一个树扩展的朴素贝叶斯分类器,然后构造一个虚拟的结点,这个结点综合了所有其他属性对于该属性节点的影响,最后对这些树扩展的朴素贝叶斯分类器进行平均。为了验证H-AODE算法分类效果,对算法进行了大量的实验,采用了UCI数据库中40多个有代表性的数据集进行了实验,同时也对AODE、HNB、KDB、TAN、NB等成熟的分类算法进行实验,最后进行了实验结果的对比分析。
【关键词】:贝叶斯网络 组合学习 朴素贝叶斯 条件独立
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP18
【目录】:
  • 摘要4-5
  • Abstract5-9
  • 第1章 绪论9-14
  • 1.1 贝叶斯网络研究的背景与意义9-10
  • 1.2 贝叶斯网络的研究现状10-12
  • 1.3 本课题的主要工作12
  • 1.4 本文的组织结构12-14
  • 第2章 相关理论知识介绍14-30
  • 2.1 贝叶斯网络基本模型14-15
  • 2.2 贝叶斯网络的学习15-20
  • 2.2.1 结构学习16-19
  • 2.2.2 参数学习19-20
  • 2.3 信息论相关知识20-21
  • 2.4 限制性贝叶斯网络模型介绍21-28
  • 2.4.1 朴素贝叶斯分类模型22-23
  • 2.4.2 树扩展朴素贝叶斯模型23-25
  • 2.4.3 k阶依赖贝叶斯模型25-27
  • 2.4.4 平均一依赖估计分类算法27-28
  • 2.5 多模型合并相关知识28-29
  • 2.6 本章小结29-30
  • 第3章 基于多模型混合的贝叶斯网络结构30-40
  • 3.1 隐藏朴素贝叶斯分类算法30-32
  • 3.2 算法分析32-33
  • 3.3 H-AODE算法33-36
  • 3.3.1 H-AODE算法思想33
  • 3.3.2 H-AODE算法描述33-34
  • 3.3.3 H-AODE算法主要步骤34-35
  • 3.3.4 后验概率计算35-36
  • 3.4 WH-AODE模型36-39
  • 3.4.1 基于属性变量和类变量互信息的改进36-37
  • 3.4.2 基于属性变量间互信息的改进37-39
  • 3.5 本章小结39-40
  • 第4章 基于UCI数据集的实验与结果分析40-54
  • 4.1 实验数据与实验方法40-45
  • 4.1.1 实验数据集描述与处理40-42
  • 4.1.2 0-1 Loss简介42-43
  • 4.1.3 Bias/Variance简介43-45
  • 4.1.4 实验方法45
  • 4.2 实验结果分析45-52
  • 4.2.1 0-1 loss 分析45-49
  • 4.2.2 Bias/Variance 分析49-51
  • 4.2.3 基于不同规模的数据集分析51-52
  • 4.3 实验总结52-53
  • 4.4 本章小结53-54
  • 第5章 总结与展望54-56
  • 5.1 课题总结54
  • 5.2 工作展望54-56
  • 参考文献56-60
  • 作者简介及在学期间所取得的科研成果60-61
  • 致谢61

【参考文献】

中国期刊全文数据库 前2条

1 孙林;徐久成;马媛媛;;基于新的条件熵的决策树规则提取方法[J];计算机应用;2007年04期

2 吴振强;马建峰;;基于联合熵的多属性匿名度量模型[J];计算机研究与发展;2006年07期

中国博士学位论文全文数据库 前5条

1 朱明敏;贝叶斯网络结构学习与推理研究[D];西安电子科技大学;2013年

2 蒋良孝;朴素贝叶斯分类器及其改进算法研究[D];中国地质大学;2009年

3 董立岩;贝叶斯网络应用基础研究[D];吉林大学;2007年

4 黄友平;贝叶斯网络研究[D];中国科学院研究生院(计算技术研究所);2005年

5 宫秀军;贝叶斯学习理论及其应用研究[D];中国科学院研究生院(计算技术研究所);2002年

中国硕士学位论文全文数据库 前7条

1 宁越;基于信息论的自筛选贝叶斯分类模型的研究与设计[D];吉林大学;2015年

2 魏会建;基于属性约简和属性加权的朴素贝叶斯分类算法的研究[D];吉林大学;2014年

3 闫渊;基于信息论和函数依赖的半监督学习[D];吉林大学;2013年

4 胡良东;共识贝叶斯网络研究及应用[D];吉林大学;2013年

5 王国才;朴素贝叶斯分类器的研究与应用[D];重庆交通大学;2010年

6 李艳美;基于贝叶斯网络的数据挖掘应用研究[D];西安电子科技大学;2008年

7 胡春玲;贝叶斯网络的结构学习算法研究[D];合肥工业大学;2006年


  本文关键词:基于多模型混合的贝叶斯网络结构的研究与改进,由笔耕文化传播整理发布。



本文编号:357471

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/357471.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户13799***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com