基于相关系数的ID3优化算法
本文关键词:基于相关系数的ID3优化算法
更多相关文章: 决策树 ID算法 信息熵 斯皮尔曼等级 相关系数
【摘要】:ID3算法是目前最具有影响力的一种决策树构造算法,但仍然有许多的缺点,例如在多值属性偏向方面的问题、计算时间复杂度高、效率不高等问题。提出了一种基于斯皮尔曼等级相关系数的ID3决策树构造优化算法,利用相关系数克服了ID3算法在多值属性偏向方面的问题,在一定程度上提高了算法的分类准确率。利用相关数学知识对计算过程进行了化简,减少了ID3算法在log运算上的运行时间。最后通过实验验证了优化后的算法是可行的,且在准确率和运行速度方面都有更好的表现。
【作者单位】: 中南大学软件学院;
【关键词】: 决策树 ID算法 信息熵 斯皮尔曼等级 相关系数
【基金】:国家自然科学基金(61379057)
【分类号】:TP311.13;TP301.6
【正文快照】: 1引言由于软件技术和互联网技术的飞速发展,我们当前正处在一个信息爆炸的时代。20世纪末数据挖掘开始逐步发展。分类算法是数据挖掘中最常用的一种数据分析方法,分类算法的作用是能根据数据集准确地区分其所属的类别。当前的主要分类技术和方法有:判别分析法、规则归纳法、决
【相似文献】
中国期刊全文数据库 前10条
1 刘成瑞,傅惠民;相关系数平稳序列滤波、预测和平滑[J];机械强度;2003年05期
2 吴晖;用电子计算器计算相关系数和进行回归运算的简易方法[J];广西气象;1982年04期
3 谢美华,王正明;基于最小相关系数的扩散去噪的最优停止时间选取[J];计算机应用;2005年05期
4 张宇镭,党琰,贺平安;利用Pearson相关系数定量分析生物亲缘关系[J];计算机工程与应用;2005年33期
5 王友国;吴乐南;;并行阈值阵列中基于相关系数的随机谐振(英文)[J];Journal of Southeast University(English Edition);2006年04期
6 祁瑞华;杨德礼;胡润波;;基于相关系数加权朴素信念分类模型[J];计算机工程与设计;2010年22期
7 张明卫;王波;张斌;朱志良;;基于相关系数的加权朴素贝叶斯分类算法[J];东北大学学报(自然科学版);2008年07期
8 钱钟泰;用相关系数表示线性回归系数的标准差[J];计量学报;1993年01期
9 林丽;余轮;;基于相关系数的EMD改进算法[J];计算机与数字工程;2008年12期
10 宋亚飞;王晓丹;雷蕾;薛爱军;;基于相关系数的证据冲突度量方法[J];通信学报;2014年05期
中国重要会议论文全文数据库 前10条
1 黄文楠;吴英秦;方志行;陈俊成;邓清政;陈思翰;;基于相关系数概念之电性测试规划探讨[A];2006中国电工技术学会电力电子学会第十届学术年会论文摘要集[C];2006年
2 赵刚;;用相关系数表征冲击波形相似程度[A];2006全国电工测试技术学术交流会论文集[C];2006年
3 许婧婧;杨子生;;云南省耕地数量分布的影响因素分析[A];中国土地资源可持续利用与新农村建设研究[C];2008年
4 蒋文瀚;陈炳为;郑建光;李万庆;李杰;;相关系数meta分析在R语言中的实现[A];2011年中国卫生统计学年会会议论文集[C];2011年
5 宋金常;王晓钧;罗苏梅;;相关系数的meta分析方法述评[A];第十一届全国心理学学术会议论文摘要集[C];2007年
6 唐凌;杨海萍;张岩;李艳;陆娟;盛军;;基于TE48C系列的大气自动监测中CO分析仪的原理及维护[A];自动化技术与冶金流程节能减排——全国冶金自动化信息网2008年会论文集[C];2008年
7 高翔;白丽娜;;基于广义相关系数的多元轨迹预测及数据恢复方法[A];2007中国控制与决策学术年会论文集[C];2007年
8 陈思宝;姚志强;胡郁;王仁华;;基于树的相关系数补偿满方差建模技术研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
9 李卫国;张俊梅;;相关系数MA(q)序列与其威利谱的关系[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
10 蔡秀华;曹鸿兴;牛保山;;列序分析及其在大气环境中的应用[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“大气气溶胶及其对气候环境的影响”分会论文集[C];2003年
中国重要报纸全文数据库 前4条
1 张光平;上海期铜与国际期铜市场相关性分析[N];期货日报;2003年
2 中国社会科学院学部委员、经济学部副主任 刘树成;不可忽视GDP[N];中国经济时报;2012年
3 高潮生;沪深证交所同一屋檐成对手[N];国际金融报;2003年
4 代立军;LLDPE运行还看上游“脸色”[N];期货日报;2009年
中国博士学位论文全文数据库 前2条
1 宋栋鸣;复杂金融网络若干问题研究[D];华东理工大学;2013年
2 孙立力;电性距离矢量用于药物定量构效关系研究[D];重庆大学;2004年
中国硕士学位论文全文数据库 前10条
1 刘丹;互斥风险性质的几种新的证明[D];曲阜师范大学;2015年
2 蒋敬;负相关二元泊松变量的生成方法研究[D];上海交通大学;2015年
3 喻凯西;朴素贝叶斯分类算法的改进及其应用[D];北京林业大学;2016年
4 王京;基于相关系数的轨迹停留点识别算法[D];华中师范大学;2016年
5 欧阳青华;基于Lamb波信号相关系数的结构损伤识别研究[D];南京航空航天大学;2016年
6 李飞;基于局部相关系数的美国次债危机传染分析[D];中国科学技术大学;2015年
7 郭华峰;尾部相关系数与资产选择研究[D];厦门大学;2014年
8 白华宁;基于相关系数的过程控制系统故障检测与诊断研究[D];西安科技大学;2014年
9 王玲玉;文献共引分析中的关联强度和相关系数改进研究[D];郑州大学;2011年
10 吴婉莹;犹豫模糊信息的相关系数和熵测度及其在群决策中的应用[D];安徽大学;2014年
,本文编号:788454
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/788454.html