当前位置:主页 > 管理论文 > 客户关系论文 >

决策树ID3算法的分析与改进

发布时间:2018-11-14 12:01
【摘要】:为了弥补ID3算法[1-3]的缺点及不足,设计了一种基于ID3算法的改进算法。它使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点,对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已知值的相对频率随机分布的思想,可以处理缺少属性值的样本。描述了通过改进的ID3算法生成决策树[4]的具体步骤,将改进算法应用到了客户关系管理系统中的客户流失分析问题当中。通过对实验结果的分析比较,得到改进算法与原ID3算法相比具有更高的预测准确率,表明了该算法的有效性。
[Abstract]:In order to remedy the shortcomings of ID3 algorithm [1-3], an improved algorithm based on ID3 algorithm is designed. It uses modified parameters to modify the information gain, overcomes the disadvantage of ID3 algorithm, which tends to select attributes with more values, and discretizes the attributes of continuous values and solves the problem of processing continuous attributes. By using the idea that samples with unknown values are randomly distributed according to the relative frequency of known values, samples lacking attribute values can be processed. This paper describes the concrete steps of generating decision tree [4] by improved ID3 algorithm, and applies the improved algorithm to customer churn analysis in customer relationship management system. Through the analysis and comparison of the experimental results, the improved algorithm has higher prediction accuracy than the original ID3 algorithm, which shows the effectiveness of the algorithm.
【作者单位】: 四川大学计算机学院;
【分类号】:TP181

【参考文献】

相关期刊论文 前8条

1 曲开社,成文丽,王俊红;ID3算法的一种改进算法[J];计算机工程与应用;2003年25期

2 叶明全;胡学钢;;一种基于灰色关联度的决策树改进算法[J];计算机工程与应用;2007年32期

3 韩松来,张辉,周华平;基于关联度函数的决策树分类算法[J];计算机应用;2005年11期

4 段玉春;朱晓艳;孙玉强;;一种改进的ID3算法[J];南阳师范学院学报(社会科学版);2006年09期

5 王艳兵;赵锐;姚青;;基于可变精度的ID3改进算法[J];计算机工程与设计;2006年14期

6 狄文辉;李卿;楼新远;;基于修正系数的决策树分类算法[J];计算机工程与设计;2008年24期

7 魏红宁;决策树剪枝方法的比较[J];西南交通大学学报;2005年01期

8 冯少荣;肖文俊;;基于样本选取的决策树改进算法[J];西南交通大学学报;2009年05期

相关硕士学位论文 前2条

1 王峰;基于决策树分类算法的企业CRM研究[D];长春理工大学;2008年

2 刘浩熙;数据挖掘在客户关系管理综合决策中的应用[D];北京邮电大学;2008年

【共引文献】

相关期刊论文 前10条

1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期

2 廖燕玲;;模糊聚类技术在甘蔗种植户信息分析中的应用[J];安徽农业科学;2007年28期

3 陈志民;李亭;杨敬锋;彭晓琴;;融入监督信息的k-mean聚类瓜蓟马预警模型[J];安徽农业科学;2009年30期

4 万雅奇;侯亚荣;王勇;张书杰;;教育考试数据挖掘系统研究与实现[J];北京工业大学学报;2009年05期

5 安颖;;基于Apriori算法的兴趣集加权关联规则挖掘[J];北京联合大学学报(自然科学版);2008年04期

6 朱学冬;胡平;;基于最优二叉树的多故障分类器的设计[J];北京联合大学学报(自然科学版);2009年02期

7 杨晓;张迎新;;Apriori算法在消费市场价格分析中的研究与应用[J];北京工商大学学报(自然科学版);2009年03期

8 柏彬;牛红利;;基于二叉树模型的HTML转换为XML的方法[J];才智;2010年03期

9 马英芝;程凤林;;基于数据挖掘技术的高校图书馆读者分析[J];科技创新与应用;2012年01期

10 曹萍;;商务智能在电子商务中的应用研究[J];科技和产业;2009年05期

相关会议论文 前10条

1 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年

2 张宇;;基于XML的Web数据自动挖掘[A];科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C];2008年

3 刘东升;;基于Mobile Agent的分布式ID3挖掘模型[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年

4 钱学君;胡小建;;决策树算法在焊接工艺设计中的应用[A];2008年安徽省科协年会机械工程分年会论文集[C];2008年

5 卜亚杰;胡朝举;;一种改进的ID3算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年

6 刘杰;周志杰;;分布式关联规则挖掘在分级网络管理中的研究[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年

7 陈媛媛;李晓;田二明;;基于粗糙集和BP网络的车牌字符识别[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅰ)[C];2008年

8 李锦泽;叶晓俊;;关联规则挖掘算法研究现状[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

9 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年

10 田琨;郭凤霞;杨宁;;基于k-近邻法的雷暴预报[A];第28届中国气象学会年会——S13雷电物理、监测预警和防护[C];2011年

相关博士学位论文 前10条

1 沈懿珍;基于协同智能的蛋白质相互作用及其网络研究[D];东华大学;2011年

2 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年

3 王炼红;人工免疫优化与分类算法及其应用研究[D];湖南大学;2009年

4 彭光金;小样本工程造价数据的智能学习方法及其在输变电工程中的应用研究[D];重庆大学;2010年

5 孔令东;基于模糊Petri网的瓦斯突出空间预测模型研究[D];中国矿业大学;2011年

6 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年

7 梁艳红;基于专利挖掘的创新设计关键技术研究[D];河北工业大学;2011年

8 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年

9 章政;基于遗传编程的电力变压器绝缘故障诊断模型研究[D];上海交通大学;2007年

10 周莺;古代情志病证医案信息数理分析[D];广州中医药大学;2007年

相关硕士学位论文 前10条

1 郭慧;数据挖掘技术对放射工作人员知觉压力因素分析[D];郑州大学;2010年

2 李媛;电子商务个性化推荐关键技术研究[D];哈尔滨工程大学;2010年

3 丛强;基于模糊关联规则Web挖掘算法的研究[D];哈尔滨工程大学;2010年

4 王宏云;基于数据挖掘的煤矿安全监测系统研究[D];辽宁工程技术大学;2009年

5 聂小芳;模糊粗糙集与支持向量机在煤与瓦斯突出预测中的应用研究[D];辽宁工程技术大学;2009年

6 周翔;决策支持技术在企业销售系统中的应用研究[D];中国海洋大学;2010年

7 刘晓霞;数据挖掘技术在高校教学管理系统中的应用研究[D];中国海洋大学;2010年

8 韩成勇;高校学评教决策支持系统设计与实现[D];苏州大学;2010年

9 张睿;ID3决策树算法分析与改进[D];兰州大学;2010年

10 葛苗苗;基于校园网的网络用户行为分析研究[D];南京财经大学;2010年

【二级参考文献】

相关期刊论文 前10条

1 吉庆华;加强客户关系管理,提高顾客忠诚度[J];北京大学学报(哲学社会科学版);2004年S1期

2 张祥建,徐晋,郭岚;企业营销中的客户价值、驱动因素及策略[J];商业研究;2004年21期

3 刘文君;邹树梁;王铁骊;;对我国会展企业实施CRM的战略性思考[J];商业研究;2005年21期

4 王扶东,朱云龙,薛劲松,李兵;基于数据挖掘的客户关系分析评价系统[J];东南大学学报(哲学社会科学版);2002年S2期

5 周明;李相平;易怡;;基于生命周期的客户知识管理策略[J];重庆大学学报(自然科学版);2006年07期

6 潘薇,叶晓俊;提高客户满意度的决策支持模型[J];哈尔滨工业大学学报;2005年04期

7 乔琳,许晖,于玉,周水庚;复杂企业决策支持环境下的数据仓库体系结构的演化[J];计算机工程与应用;2000年07期

8 李智,王正肖,方水良;基于决策支持的客户关系管理研究[J];计算机工程与应用;2003年08期

9 曲开社,成文丽,王俊红;ID3算法的一种改进算法[J];计算机工程与应用;2003年25期

10 刘鹏;一种健壮有效的决策树改进模型[J];计算机工程与应用;2005年33期

相关硕士学位论文 前2条

1 文专;基于神经网络的分类数据挖掘属性选择和规则抽取研究[D];天津大学;2004年

2 孙_";数据挖掘中的决策树方法及其在客户分类中的应用[D];大连理工大学;2004年

【相似文献】

相关期刊论文 前10条

1 孙友友;郭晓燕;;决策树与聚类算法在数据挖掘中的研究及应用[J];科技创新导报;2007年34期

2 王善侠;王振华;王吉永;;基于决策树和聚类理论的XML文档数据挖掘的研究[J];科技信息(科学教研);2007年34期

3 彭玉楼,刘亚辉;利用决策树和聚类理论对XML文档数据挖掘的研究[J];株洲工学院学报;2005年04期

4 李会;胡笑梅;;决策树中ID3算法与C4.5算法分析与比较[J];水电能源科学;2008年02期

5 于承敏;郑丽萍;刘永涛;;数据挖掘在高校学生综合测评成绩分析中的应用[J];电脑与电信;2009年10期

6 郑丽萍;;Id3算法的研究及应用[J];硅谷;2008年24期

7 陶灵姣;孙继银;李智;郭文普;;远程教育考试成绩分析决策树的构造方法[J];计算机工程与设计;2006年06期

8 王永梅;;ID3算法在计算机成绩分析中的应用[J];合肥学院学报(自然科学版);2010年01期

9 郭娜;田亚菲;郝洁;贾存丽;;一种基于改进DRNN网络的决策树构建方法[J];软件;2010年11期

10 黄维维;叶建伟;张宏莉;;基于ID3决策树的木马动态检测技术研究[J];智能计算机与应用;2011年03期

相关会议论文 前10条

1 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年

2 段巍巍;;电信客户流失预测主题建模[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年

3 陈平;乔秀全;刘臻;田小萍;;数据挖掘网格中决策树并行算法设计及性能分析[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年

4 朱强生;田英;周延泉;何华灿;;银行业中的客户数据挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年

5 黄章树;黄丽钦;;数据挖掘技术在电信增值服务行业中的应用[A];2004年中国管理科学学术会议论文集[C];2004年

6 周红梅;薛青;;数据挖掘技术及其在装备作战仿真系统中的应用[A];第五届全国仿真器学术会论文集[C];2004年

7 姜慧;张冬艳;;决策树在建设工程款拖欠问题中的应用研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年

8 刘建华;;一个智能搜索引擎的用户行为聚类分析[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年

9 李小明;孙金城;;数据挖掘在汉语语音合成中的应用[A];图像 仿真 信息技术——第二届联合学术会议论文集[C];2002年

10 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年

相关重要报纸文章 前10条

1 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年

2 创智集团副总裁 胡乐群博士;数据挖掘在CRM中的应用[N];中国计算机报;2002年

3 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年

4 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年

5 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年

6 张立明;数据挖掘之道[N];网络世界;2003年

7 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年

8 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年

9 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年

10 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年

相关博士学位论文 前10条

1 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年

2 王曙燕;医学图像智能分类算法研究[D];西北大学;2006年

3 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年

4 赵基;基于数据挖掘的银行客户分析管理关键技术研究[D];浙江大学;2005年

5 李兴森;智能知识及其管理模式研究[D];中国科学院研究生院;2008年

6 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年

7 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年

8 贺琳;基于数据挖掘的道路运行安全风险分析[D];大连海事大学;2012年

9 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年

10 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年

相关硕士学位论文 前10条

1 易s,

本文编号:2331099


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/2331099.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7a0f1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com