若干改进朴素贝叶斯分类算法的研究与应用
发布时间:2021-01-06 10:11
分类作为数据挖掘领域中的核心研究内容,在现实生活中有着非常广泛的应用,例如根据病人的临床病症属性判断病人患了什么病。常见的构造分类器的方法有很多,如贝叶斯网络、支持向量机、人工神经网络和模糊集等等。而朴素贝叶斯分类算法作为贝叶斯算法家族中的一种经典分类算法,因其结构简单、计算高效的特性得到了广大学者的重视。朴素贝叶斯分类算法基于这样一种假设:在给定类标记时,属性值之间是相互条件独立的。这种假设虽使得其计算简单,但同时也限制了它在许多属性间相关性较强的数据集上的分类表现。因此学者们纷纷从放松它的假设条件入手提出了众多的改进算法,平均单一依赖估计算法和隐朴素贝叶斯算法则是其中的优秀代表。它们不仅极大提高了原算法的分类精确度,而且还在众多不同种类的数据集上均有较好的分类表现。本文以平均单一依赖估计算法和隐朴素贝叶斯算法为基本研究对象,并考虑到在实际应用中数据类型对分类的影响,提出了两个基于属性加权的平均单一依赖估计算法和一个基于属性值加权的隐朴素贝叶斯算法。具体的研究工作如下:(1)通过研究朴素贝叶斯分类算法和平均单一依赖估计算法,分别提出了基于相关系数Tau-y和Lambda-y的属性加权...
【文章来源】:山东科技大学山东省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图2.2?NBC算法结构图??Figrue2.2?NBC?algorithm?structure?diagram??
?(2?⑴??i=\??一般情况下,使用贝叶斯公式进行贝叶斯推断的基本模式可以总结为图2.1。??先验信息??????????贝叶斯定理——>?先验分布?令预测分类??样本信息??图2.1贝叶斯推断基本模式图??Figure2.1?Bayesian?inference?basic?pattern??2.3朴素贝叶斯分类算法??NBC算法是基于贝叶斯理论的有监督的学习方法,并且它有一个假设条件:??一个实例在给定类标记的条件下,它的所有属性值是相互独立的[37]。因此NBC??算法的结构如图2.2所示(此处和后面介绍的算法均以四属性为例展示算法描述??的属性间的关系)。??廣'??G?6?Q?Q??图2.2?NBC算法结构图??Figrue2.2?NBC?algorithm?structure?diagram??在图2.2中,C为训练集中的类标记集合,我们将其称为类别,4为训练集??中第/个属性。NBC算法在对有众多属性的训练集进行分类实验时,表现出了很??好的分类效果和极快的分类速度,这很大程度上得益于NBC算法的条件独立性??9??
有其它的属性共同作用产生的,%p,为為^的取值。HNB算法假设一个实例在给??定类标记和隐藏父属性值的条件下,它的属性值间是相互独立的,因此可以知??道HNB算法的结构如图2.4所示。??,一J、、??立??,.丄??/?\?/?\?/?\/??\?為y?l?-^9^2?/?u^/tp4?/???、???图2.4?HNB算法结构图??Figure2.4?HNB?algorithm?structure?diagram??通过上面的介绍,我们可以知道由HNB算法定义的联合概率的公式为:??iVP4,...,4,C)?|^,,C)。?(2.24)??/=1?丨??在这里户以,|?j_,C)的计算公式为:??i:?。?(2.25)??I?J〇i??由上式就可以看出对于一个属性?<,其隐藏父属性实际上是由其它所有??属性进行混合加权得到的。??由此得到了?HNB算法针对一个测试实例义=(〇|
【参考文献】:
期刊论文
[1]基于粗糙集的加权朴素贝叶斯邮件过滤方法[J]. 邓维斌,王国胤,洪智勇. 计算机科学. 2011(02)
[2]应用模糊识别方法判别油水层[J]. 申辉林,王敏. 勘探地球物理进展. 2007(02)
[3]基因表达式程序设计方法在采煤工作面瓦斯涌出量预测中的应用[J]. 李曲,蔡之华,朱莉,赵云胜. 应用基础与工程科学学报. 2004(01)
[4]对应分析油气水层识别方法及应用[J]. 张文宾,林景晔,刘概琴,韦学锐. 大庆石油地质与开发. 2002(06)
[5]基于Rough Set理论的油层识别方法[J]. 陈遵德. 地球物理学进展. 1998(04)
[6]基于属性相关性分析的贝叶斯分类模型[J]. 章舜仲,王树梅,黄河燕,陈肇雄. 情报学报. 2007 (02)
博士论文
[1]朴素贝叶斯分类器及其改进算法研究[D]. 蒋良孝.中国地质大学 2009
硕士论文
[1]基于属性选择的朴素贝叶斯分类研究与应用[D]. 杜婷.中国科学技术大学 2016
[2]天灸干预喘息性支气管炎急性发作期治疗的临床研究[D]. 向菲.广州中医药大学 2016
[3]西汉名医淳于意研究[D]. 门淑芬.兰州大学 2012
[4]基于互信息的多层隐朴素贝叶斯算法研究[D]. 李晶辉.湖南大学 2012
[5]朴素贝叶斯分类及其应用研究[D]. 段晶.大连海事大学 2011
本文编号:2960383
【文章来源】:山东科技大学山东省
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图2.2?NBC算法结构图??Figrue2.2?NBC?algorithm?structure?diagram??
?(2?⑴??i=\??一般情况下,使用贝叶斯公式进行贝叶斯推断的基本模式可以总结为图2.1。??先验信息??????????贝叶斯定理——>?先验分布?令预测分类??样本信息??图2.1贝叶斯推断基本模式图??Figure2.1?Bayesian?inference?basic?pattern??2.3朴素贝叶斯分类算法??NBC算法是基于贝叶斯理论的有监督的学习方法,并且它有一个假设条件:??一个实例在给定类标记的条件下,它的所有属性值是相互独立的[37]。因此NBC??算法的结构如图2.2所示(此处和后面介绍的算法均以四属性为例展示算法描述??的属性间的关系)。??廣'??G?6?Q?Q??图2.2?NBC算法结构图??Figrue2.2?NBC?algorithm?structure?diagram??在图2.2中,C为训练集中的类标记集合,我们将其称为类别,4为训练集??中第/个属性。NBC算法在对有众多属性的训练集进行分类实验时,表现出了很??好的分类效果和极快的分类速度,这很大程度上得益于NBC算法的条件独立性??9??
有其它的属性共同作用产生的,%p,为為^的取值。HNB算法假设一个实例在给??定类标记和隐藏父属性值的条件下,它的属性值间是相互独立的,因此可以知??道HNB算法的结构如图2.4所示。??,一J、、??立??,.丄??/?\?/?\?/?\/??\?為y?l?-^9^2?/?u^/tp4?/???、???图2.4?HNB算法结构图??Figure2.4?HNB?algorithm?structure?diagram??通过上面的介绍,我们可以知道由HNB算法定义的联合概率的公式为:??iVP4,...,4,C)?|^,,C)。?(2.24)??/=1?丨??在这里户以,|?j_,C)的计算公式为:??i:?。?(2.25)??I?J〇i??由上式就可以看出对于一个属性?<,其隐藏父属性实际上是由其它所有??属性进行混合加权得到的。??由此得到了?HNB算法针对一个测试实例义=(〇|
【参考文献】:
期刊论文
[1]基于粗糙集的加权朴素贝叶斯邮件过滤方法[J]. 邓维斌,王国胤,洪智勇. 计算机科学. 2011(02)
[2]应用模糊识别方法判别油水层[J]. 申辉林,王敏. 勘探地球物理进展. 2007(02)
[3]基因表达式程序设计方法在采煤工作面瓦斯涌出量预测中的应用[J]. 李曲,蔡之华,朱莉,赵云胜. 应用基础与工程科学学报. 2004(01)
[4]对应分析油气水层识别方法及应用[J]. 张文宾,林景晔,刘概琴,韦学锐. 大庆石油地质与开发. 2002(06)
[5]基于Rough Set理论的油层识别方法[J]. 陈遵德. 地球物理学进展. 1998(04)
[6]基于属性相关性分析的贝叶斯分类模型[J]. 章舜仲,王树梅,黄河燕,陈肇雄. 情报学报. 2007 (02)
博士论文
[1]朴素贝叶斯分类器及其改进算法研究[D]. 蒋良孝.中国地质大学 2009
硕士论文
[1]基于属性选择的朴素贝叶斯分类研究与应用[D]. 杜婷.中国科学技术大学 2016
[2]天灸干预喘息性支气管炎急性发作期治疗的临床研究[D]. 向菲.广州中医药大学 2016
[3]西汉名医淳于意研究[D]. 门淑芬.兰州大学 2012
[4]基于互信息的多层隐朴素贝叶斯算法研究[D]. 李晶辉.湖南大学 2012
[5]朴素贝叶斯分类及其应用研究[D]. 段晶.大连海事大学 2011
本文编号:2960383
本文链接:https://www.wllwen.com/kejilunwen/yysx/2960383.html