数据挖掘中的属性选择偏差抑制算法研究
本文关键词:数据挖掘中的属性选择偏差抑制算法研究
【摘要】:决策树算法广泛应用于数据挖掘领域之中.属性选择是决策树方法挖掘效率的关键,但ID3方法和C4.5方法在选择属性时,都会产生一定程度的选择偏差.据此,该文对信息增益模型进行了改进,将多次对数运算的信息熵求取过程简化为多值求和,从而规避了属性选择出现偏差的可能性,也加快了决策树构建的执行速度.依托学生情况数据展开的实验研究表明,与经典的ID3方法相比,该文方法构建的决策树更加简洁.同时,随着数据样本数量的增大,该文方法的执行时间大为降低.
【作者单位】: 百色学院信息工程学院;
【关键词】: 数据挖掘 决策树 属性选择 偏差抑制
【基金】:广西自然科学基金青年基金项目(2014GXNSFBA118283)
【分类号】:TP311.13
【正文快照】: 信息化技术的飞速发展,使得人们获得信息的渠道日益丰富,来自生产生活各个领域的数据信息让人们应接不暇.对海量的数据信息进行整理,并从中寻找到对自己有价值的信息至关重要,这就推动了数据发掘技术的不断进步[1].近年来,数据挖掘技术形成了重要的分支:基于决策树的挖掘方法
【相似文献】
中国期刊全文数据库 前10条
1 香丽芸;浅谈数据挖掘及其应用[J];昌吉师专学报;2001年02期
2 郑雪燕,张杰明,岳洋;数据挖掘语言[J];计算机时代;2001年11期
3 刘明晶;数据挖掘[J];华南金融电脑;2001年04期
4 张伟;刘勇国;彭军;廖晓峰;吴中福;;数据挖掘发展研究[J];计算机科学;2001年07期
5 钟晓;马少平;张钹;俞瑞钊;;数据挖掘综述[J];模式识别与人工智能;2001年01期
6 朱建平,张润楚;数据挖掘的发展及其特点[J];统计与决策;2002年07期
7 傅岚;在数据海洋中打捞信息数据挖掘[J];科技广场;2002年11期
8 李峻;数据挖掘,企业洞察先机的“慧眼”[J];中国计算机用户;2002年48期
9 罗可,蔡碧野,卜胜贤,谢中科;数据挖掘及其发展研究[J];计算机工程与应用;2002年14期
10 ;2002数据挖掘研讨班[J];计算机工程;2002年06期
中国重要会议论文全文数据库 前10条
1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
2 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
3 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
4 ;数据挖掘:如何挖出效益?[N];中国计算机报;2004年
5 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
6 电脑商报记者 谢涛;数据挖掘:未来政府信息化的重要环节[N];电脑商报;2007年
7 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年
8 本报特约撰稿 许丽萍;数据挖掘:软件应用的新境界[N];计算机世界;2009年
9 谢立宏博士;企业的“黄金眼”数据挖掘决策支持[N];中国计算机报;2002年
10 吴勇毅;危机下,数据挖掘与提供信息决策是关健[N];中国冶金报;2009年
中国博士学位论文全文数据库 前10条
1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年
2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年
3 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年
4 李荣;生物信息数据挖掘若干关键问题研究与应用[D];复旦大学;2004年
5 李玉华;面向服务的数据挖掘关键技术研究[D];华中科技大学;2006年
6 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年
7 王珊珊;知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用[D];中国科学技术大学;2009年
8 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年
9 陈平;数据挖掘网格若干关键技术研究[D];北京邮电大学;2007年
10 巩建光;面向电信领域的数据挖掘关键技术研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年
2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年
3 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年
4 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年
5 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年
6 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年
7 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年
8 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年
9 顾欣;基于数据挖掘药房管理系统设计与开发[D];中国石油大学(华东);2014年
10 李慧;基于数据挖掘的人寿保险客户细分研究[D];安徽大学;2015年
,本文编号:950785
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/950785.html