贝叶斯决策树方法在招生数据挖掘中的应用
本文选题:数据挖掘 + 贝叶斯决策树 ; 参考:《计算机技术与发展》2016年04期
【摘要】:文中首先简单介绍了贝叶斯决策树方法的基本思想,该方法结合了贝叶斯分类的先验信息方法和决策树分类的信息增益方法的优点,加入贝叶斯节点弥补了决策树不能处理具有二义性或存在缺失值数据的缺点。在此基础上,文中设计了一种基于朴素贝叶斯方法和ID3算法的贝叶斯决策树算法——NBDT-ID3算法,并给出了该算法的设计及分析过程。然后将该算法应用到高职招生数据挖掘中,对新生报到情况进行分析与预测,并在Matlab环境下进行了实验验证。实验结果表明,NBDT-ID3算法在付出一定时间代价的情况下,不仅可以获得更高的分类精度,而且在处理二义性、不完整或不一致数据方面具有更好的效果。
[Abstract]:In this paper, the basic idea of Bayesian decision tree method is introduced briefly, which combines the advantages of the prior information method of Bayesian classification and the information gain method of decision tree classification.Adding Bayesian nodes makes up for the fact that the decision tree can not deal with ambiguous or missing value data.On this basis, a Bayesian decision tree algorithm based on naive Bayesian method and ID3 algorithm, NBDT-ID3 algorithm, is designed, and the design and analysis process of the algorithm is given.Then, the algorithm is applied to the data mining of higher vocational enrollment, and the new students' registration situation is analyzed and forecasted, and the experimental results are verified under the environment of Matlab.The experimental results show that the NBDT-ID3 algorithm can not only obtain higher classification accuracy but also deal with ambiguous incomplete or inconsistent data at a certain time cost.
【作者单位】: 武汉大学计算机学院;广西英华国际职业学院工信学院;
【基金】:中央高校基本科研业务费专项基金项目(2042014f0057) 湖北省自然科学基金项目(2014CFB289)
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 李业丽,常桂然,徐茜;神经网络在数据挖掘中的应用研究[J];计算机工程与应用;2000年08期
2 陈国萍,李巍,刘仲英;数据挖掘中概念树的标准、生成和实现[J];计算机工程;2000年12期
3 朱天翔,李力;相关案件的数据挖掘[J];计算机应用研究;2000年03期
4 赵丹群;数据挖掘:原理、方法及其应用[J];现代图书情报技术;2000年06期
5 余英泽,廖里,吴渝;一种新型数据分析技术——数据挖掘[J];计算机与现代化;2000年01期
6 邵华 ,万家华 ,金翔义;数据挖掘在证券行业中的应用[J];软件工程师;2000年11期
7 王宏;数据挖掘在网络营销中的应用[J];计算机应用与软件;2000年06期
8 何东峰;数据挖掘要适当[J];互联网周刊;2000年Z1期
9 康松林,费洪晓;数据挖掘的软分类方法[J];长沙铁道学院学报;2001年03期
10 邢平平,施鹏飞,赵奕;基于本体论的数据挖掘方法[J];计算机工程;2001年05期
相关会议论文 前10条
1 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
2 李久丹;陈剑;覃涛;;数据挖掘技术理论研究[A];广西计算机学会2010年学术年会论文集[C];2010年
3 张秋彤;;数据挖掘与高校图书馆个性化信息服务[A];第九届中国不确定系统年会、第五届中国智能计算大会、第十三届中国青年信息与管理学者大会论文集[C];2011年
4 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
5 段培俊;周东岱;;数据挖掘研究综述[A];2003年中国智能自动化会议论文集(下册)[C];2003年
6 雷宇;;论行业信息资源的数据挖掘[A];中国烟草行业信息化研讨会论文集[C];2004年
7 吴以凡;吴铁军;欧阳树生;;面向生产过程质量控制的动态数据挖掘方法[A];05'中国自动化产业高峰会议暨中国企业自动化和信息化建设论坛论文集[C];2005年
8 孙明;康红梅;莫一;;数据挖掘在科技奖励管理系统专家库中的应用[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年
9 邵红全;杨菊梅;潘建雄;;数据挖掘的策略与实现技术[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
10 叶伟芳;徐迪;;数据挖掘及其在金融领域的应用[A];中国企业运筹学学术交流大会论文集[C];2005年
相关重要报纸文章 前10条
1 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
2 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
3 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
4 ;数据挖掘:如何挖出效益?[N];中国计算机报;2004年
5 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
6 电脑商报记者 谢涛;数据挖掘:未来政府信息化的重要环节[N];电脑商报;2007年
7 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年
8 本报特约撰稿 许丽萍;数据挖掘:软件应用的新境界[N];计算机世界;2009年
9 谢立宏博士;企业的“黄金眼”数据挖掘决策支持[N];中国计算机报;2002年
10 吴勇毅;危机下,,数据挖掘与提供信息决策是关健[N];中国冶金报;2009年
相关硕士学位论文 前10条
1 杨毅超;基于Web数据挖掘的作物商务平台分析与研究[D];湖南农业大学;2008年
2 徐进华;基于灰色系统理论的数据挖掘及其模型研究[D];北京交通大学;2009年
3 俞驰;基于网络数据挖掘的客户获取系统研究[D];西安电子科技大学;2009年
4 冯军;数据挖掘在自动外呼系统中的应用[D];北京邮电大学;2009年
5 于宝华;基于数据挖掘的高考数据分析[D];天津大学;2009年
6 王仁彦;数据挖掘与网站运营管理[D];华东师范大学;2010年
7 彭智军;数据挖掘的若干新方法及其在我国证券市场中应用[D];重庆大学;2005年
8 涂继亮;基于数据挖掘的智能客户关系管理系统研究[D];哈尔滨理工大学;2005年
9 贾治国;数据挖掘在高考填报志愿上的应用[D];内蒙古大学;2005年
10 马飞;基于数据挖掘的航运市场预测系统设计及研究[D];大连海事大学;2006年
本文编号:1771341
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1771341.html