朴素贝叶斯与决策树混合分类方法的研究
本文关键词:朴素贝叶斯与决策树混合分类方法的研究,,由笔耕文化传播整理发布。
【摘要】:数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,并且能有效地从低信噪比数据中挖掘有价值的信息。分类的模型主要包括朴素贝叶斯、决策树、支持向量机等。朴素贝叶斯和决策树以算法简单、计算量小以及分类结果对噪音鲁棒等特点而得到广泛运用。本文从以下几个方面着眼,改进朴素贝叶斯和决策树算法:(1)尽管朴素贝叶斯的分类结果受到广泛承认,但是面对某些特殊情形,依然存在两个缺陷,即属性间必须满足独立的条件,以及概率估计方式粗糙的问题。针对朴素贝叶斯概率估计粗糙的问题,本文提出了基于朴素贝叶斯的概率优化算法。将概率优化函数运用到朴素贝叶斯中,充分考虑到朴素贝叶斯中条件概率为零的属性,从而避免了朴素贝叶斯易下溢和过度拟合的问题。本文采用了UCI数据集进行了多组验,与传统分类算法进行比较。实验结果表明在高维数据中,基于朴素贝叶斯的概率优化算法算法提高了分类准确率,表现出了优良的性能。(2)在针对多类标签的分类问题上,文中介绍了朴素贝叶斯与决策树的混合分类算法,由于在训练集中存在有噪声矛盾的实例,将使决策树遭遇过度拟合并且致使精确度下降。在构造决策树之前运用本文提出的朴素贝叶斯的概率优化算法进行预处理,来移除训练集中的噪音实例,从而避免决策树算法的过度拟合。本文采用UCI数据集,采用10倍交叉验证的方法,对论文中提出的算法进行实验。通过大量对比实验显示,本文中提出的方法产生了较好的结果。朴素贝叶斯与决策树的混合算法还允许我们自动的从拥有高维属性的噪声数据中抽取最具有代表性和高质量的数据集,并且根据不同的实例特征挑选出重要的属性。(3)本文将提出的朴素贝叶斯的概率优化算法和朴素贝叶斯与决策树的混合算法应用在冠心病中医辅助诊疗系统中,成功地对病人病症进行了分类,在冠心病的诊疗过程中起到了有效的辅助作用。
【关键词】:分类算法 朴素贝叶斯 概率估计 决策树
【学位授予单位】:大连海事大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP18;TP311.13
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 第1章 绪论10-18
- 1.1 课题研究背景和意义10-11
- 1.2 国内外研究现状11-16
- 1.2.1 朴素贝叶斯分类算法的研究现状11-14
- 1.2.2 决策树算法的研究现状14-16
- 1.2.3 朴素贝叶斯与其他算法结合的研究现状16
- 1.3 论文主要工作和组织结构16-18
- 第2章 相关理论概述18-26
- 2.1 数据挖掘的概述18-19
- 2.1.1 数据挖掘的主要任务18
- 2.1.2 数据挖掘的流程18-19
- 2.2 分类的定义19-21
- 2.2.1 分类器的评估方法19-20
- 2.2.2 常见的分类器的介绍20-21
- 2.3 朴素贝叶斯分类方法21-24
- 2.3.1 贝叶斯理论21-22
- 2.3.2 朴素贝叶斯方法22-24
- 2.4 决策树分类方法24-26
- 第3章 基于朴素贝叶斯的概率估计优化算法26-39
- 3.1 引言26
- 3.2 朴素贝叶斯中的概率修正方法介绍26-28
- 3.2.1 Laplace方法26-27
- 3.2.2 m-估计方法27
- 3.2.3 健壮性概率估计方法27-28
- 3.3 优化函数的介绍28-30
- 3.4 基于朴素贝叶斯的概率估计优化算法30-32
- 3.5 实验与结果分析32-37
- 3.5.1 数据集描述32-33
- 3.5.2 实验设计33-34
- 3.5.3 实验结果分析34-37
- 3.6 本章小结37-39
- 第4章 朴素贝叶斯与决策树混合分类算法39-51
- 4.1 引言39
- 4.2 决策树算法C5.039-41
- 4.3 朴素贝叶斯与决策树混合分类算法41-42
- 4.4 实验与结果分析42-50
- 4.4.1 数据集描述42-43
- 4.4.2 实验设计43-45
- 4.4.3 实验结果分析45-50
- 4.5 本章小结50-51
- 第5章 朴素贝叶斯与决策树混合分类算法的实际应用系统51-55
- 5.1 引言51
- 5.2 应用系统的实现51-54
- 5.2.1 系统框架设计52
- 5.2.2 系统开发工具与平台52-53
- 5.2.3 应用系统的呈现53-54
- 5.3 本章小结54-55
- 第6章 总结与展望55-58
- 6.1 总结55-56
- 6.2 未来展望56-58
- 参考文献58-64
- 致谢64
【相似文献】
中国期刊全文数据库 前10条
1 钱颖能;胡运发;;用朴素贝叶斯分类法选股[J];计算机应用与软件;2007年06期
2 欧阳泽华;郭华平;范明;;在逐渐缩小的空间上渐进学习朴素贝叶斯参数[J];计算机应用;2012年01期
3 裴亚辉;熊盛武;;朴素贝叶斯及其扩展模型[J];网络安全技术与应用;2007年08期
4 赵彦琦;谢小西;荀宇畅;;朴素贝叶斯分类法的应用[J];电子制作;2013年07期
5 菅小艳;崔彩霞;;基于朴素贝叶斯的文本分类[J];电脑开发与应用;2013年12期
6 王实;高文;;增强型朴素贝叶斯学习[J];计算机科学;2000年04期
7 杨忠强;秦亮曦;;一种基于属性加权的朴素贝叶斯改进算法[J];广西大学学报(自然科学版);2013年05期
8 张彩丽;杨帆;张玉杰;;柴油机供油系统状态的朴素贝叶斯诊断方法研究[J];计算机测量与控制;2008年08期
9 白耀辉;陈明;王举群;;利用朴素贝叶斯方法实现异常检测[J];计算机工程与应用;2005年34期
10 王双成;冷翠平;侯彩虹;;操作风险等级预测的朴素贝叶斯方法研究[J];计算机工程与应用;2008年12期
中国重要会议论文全文数据库 前2条
1 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 李海军;王钲旋;王利民;苑森淼;;基于主成分分析提升朴素贝叶斯[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
中国硕士学位论文全文数据库 前10条
1 李Pr;基于朴素贝叶斯的文本分类研究及其在微博分类中的应用[D];北京理工大学;2015年
2 李冬梅;朴素贝叶斯与决策树混合分类方法的研究[D];大连海事大学;2016年
3 胡为成;基于遗传算法的朴素贝叶斯分类研究[D];合肥工业大学;2006年
4 刘勇华;基于朴素贝叶斯的中文段落情感分析[D];太原理工大学;2015年
5 周龙;基于朴素贝叶斯的分类方法研究[D];安徽大学;2006年
6 王翔;基于朴素贝叶斯和One-R的入侵检测问题研究[D];合肥工业大学;2008年
7 周远阳;基于朴素贝叶斯方法的新闻分类系统的实现[D];暨南大学;2012年
8 李忠波;基于改进朴素贝叶斯的蛋白质提纯方法选择[D];大连理工大学;2014年
9 孙秀亮;基于属性加权的选择性朴素贝叶斯分类研究[D];哈尔滨工程大学;2013年
10 华林森;中文文本情感分类研究[D];重庆大学;2014年
本文关键词:朴素贝叶斯与决策树混合分类方法的研究,由笔耕文化传播整理发布。
本文编号:291356
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/291356.html