基于遗传算法的数据挖掘在客户关系管理中的应用研究
本文关键词:基于遗传算法的数据挖掘在客户关系管理中的应用研究,由笔耕文化传播整理发布。
【摘要】:近年来信息产业的飞速发展,使得人们的生活节拍越来越快,我们可以随时随地获取我们所需要的信息,在很多领域,数据都在以不同形式急速地增长,通过对数据库的检索或查询而得出的数据已经无法满足我们所需要的结果。如何根据数据库中的数据信息,挖掘出其背后潜在的联系,为决策者做出关键决策提供依据,从而使企业获得更大的利益,是数据挖掘的重要目标和现实意义。 分类是数据挖掘的主要任务之一,分类的方法有很多种,其中决策树分类算法是数据分类和预测的常用工具。C4.5是最常用的决策树分类方法。该算法具有计算复杂度低,分类精度高等特点。但该算法选取最大的属性增益率作为划分属性,一旦建立,很难悔改,由此极易陷入局部最优解。遗传算法是模仿生物界的进化规律而演化来的随机搜索算法,具有强大的全局寻优能力,从而搜索到最优解。遗传算法采用适应度函数来评价个体解,当个体的适应度值较大时,被选择的概率增加,后代中所含该基因的概率增加,则种群的解趋于某个解,失去了多样性解,算法过早的收敛,也就是常说的“早熟”现象。免疫遗传算法是在遗传算法中借鉴生物免疫学原理,利用抗体的浓度和亲和度来选择个体,从而提高个体选择的多样性,以此来克服遗传算法的早熟问题,提高全局搜索能力。 如何利用免疫遗传算法更好地优化C4.5分类算法,优势互补,提高分类精度,是本文的研究目的。首先,利用C4.5算法构建决策树,用模糊分类规则表示每条决策树分支,形成一个完整的分类规则集,然后,将分类规则集中的每条规则作为个体,利用免疫遗传算法基于浓度和亲和度的基础上选择优秀的个体进行遗传操作,输出新的抗体,形成新的分类规则。最后,当种群的进化代数达到指定的终止代数时,免疫遗传算法停止。与C4.5算法相比,该算法有效地提高了决策树的分类精度。文章最后将改进的算法运用到银行客户关系管理中,对客户进行风险等级评估,得到了良好的分类效果。
【关键词】:C4.5 决策树 遗传算法 免疫遗传算法 数据挖掘 客户关系管理
【学位授予单位】:大连交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP18;TP311.13
【目录】:
- 摘要5-6
- Abstract6-8
- 目录8-11
- 第一章 绪论11-19
- 1.1 选题背景及意义11-12
- 1.2 国内外研究现状12-17
- 1.2.1 客户关系管理的现状12-13
- 1.2.2 数据挖掘的现状13-16
- 1.2.3 遗传算法的现状16-17
- 1.3 本文的主要工作与结构17-18
- 1.3.1 本文的主要工作17
- 1.3.2 本文的结构安排17-18
- 本章小结18-19
- 第二章 数据挖掘及分类方法的概述19-33
- 2.1 数据挖掘的理论19-21
- 2.1.1 数据挖掘的概念19
- 2.1.2 数据挖掘的任务19-20
- 2.1.3 数据挖掘的过程20-21
- 2.2 分类的概述21-22
- 2.2.1 分类的基本概念21
- 2.2.2 分类的步骤21-22
- 2.3 决策树方法22-30
- 2.3.1 决策树算法的基本理论22-23
- 2.3.2 决策树的生成23
- 2.3.3 决策树的剪枝算法23-24
- 2.3.4 常用的决策树分类算法24-30
- 2.4 分类算法评价标准与方法30-31
- 2.5 数据挖掘在CRM中的应用31-32
- 本章小结32-33
- 第三章 免疫遗传算法33-43
- 3.1 遗传算法33-37
- 3.1.1 遗传算法的原理33
- 3.1.2 遗传算法的基本操作33-36
- 3.1.3 遗传算法的特点36-37
- 3.2 免疫遗传算法37-40
- 3.2.1 免疫遗传算法的基本原理37-38
- 3.2.2 免疫遗传算法的具体流程38-40
- 3.2.3 免疫遗传算法特点40
- 3.3 仿真实验40-42
- 本章小结42-43
- 第四章 基于免疫遗传算法的分类算法(NIGCA)分析43-50
- 4.1 问题的提出43
- 4.2 基于免疫遗传算法的决策树构造思想43
- 4.3 基于免疫遗传算法的决策树算法的设计43-49
- 4.3.1 编码方案43-44
- 4.3.2 初始种群及适应度函数的设计44-45
- 4.3.3 选择操作45-46
- 4.3.4 交叉和变异操作46
- 4.3.5 改进算法的流程46-47
- 4.3.6 实验结果及分析47-49
- 本章小结49-50
- 第五章 NIGCA算法在银行客户关系管理中的应用分析50-59
- 5.1 引言50-51
- 5.2 挖掘的目的51
- 5.3 模型的实现51-58
- 5.3.1 运行环境及挖掘工具51-53
- 5.3.2 数据的准备53-56
- 5.3.3 挖掘结果及分析56-58
- 5.4 模型的评估58
- 本章小结58-59
- 结论59-61
- 参考文献61-64
- 附录A 附录内容名称64-66
- 攻读硕士学位期间发表的学术论文66-67
- 致谢67
【相似文献】
中国期刊全文数据库 前10条
1 苑进,孙忠林,刘雪美;改进遗传算法在齿轮减速器优化中的应用[J];山东科技大学学报(自然科学版);2001年04期
2 刘雅琴,迟洪钦;最优合并构成的有序遗传算法[J];上海师范大学学报(自然科学版);2001年04期
3 程锦松;求多项式全部根的遗传算法[J];微机发展;2001年01期
4 程锦松,刘锋;基于分布理论和遗传算法的多项式求根算法[J];微机发展;2001年06期
5 周林,娄寿春,赵杰;基于遗传算法的目标优化分配模型[J];系统仿真学报;2001年03期
6 赵胜利;李书全;刘燕;刘永建;田伟;;用遗传算法确定鲍罗米公式中的系数A、B值[J];河北农业大学学报;2002年03期
7 许世刚,高新陵;分流机制遗传算法研究[J];系统工程与电子技术;2002年07期
8 孙进平 ,吴瑞明 ,翟瑞红 ,刘忠武;基于遗传算法的工艺决策模式的探索[J];现代制造工程;2002年01期
9 胡静,陈恩红,王上飞,王熙法;交互式遗传算法中收敛性及用户评估质量的提高[J];中国科学技术大学学报;2002年02期
10 吴青萍;一种新的优化方法——遗传算法原理及其应用[J];常州信息职业技术学院学报;2002年02期
中国重要会议论文全文数据库 前10条
1 韩娟;;遗传算法概述[A];第三届河南省汽车工程科技学术研讨会论文集[C];2006年
2 庞国仲;王元西;;基于遗传算法控制步长的定性仿真方法[A];'2000系统仿真技术及其应用学术交流会论文集[C];2000年
3 林家恒;李国锋;田国会;刘长有;;遗传算法在旋转货架拣选优化中的应用[A];1996中国控制与决策学术年会论文集[C];1996年
4 史骏;裘聿皇;;遗传算法中基因排列方式对运行的影响[A];1996年中国控制会议论文集[C];1996年
5 韩战钢;;遗传算法及在经济中的应用[A];Optimization Method, Econophysics and Risk Management--Proceedings of CCAST (World Laboratory) Workshop[C];2001年
6 唐毅;葛运建;王定成;江建举;;遗传算法在运动员技术动作优化中的应用研究[A];2003年中国智能自动化会议论文集(下册)[C];2003年
7 文泾;朱玉文;;用遗传算法进行航线规划[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
8 于春梅;黄玉清;杨胜波;;遗传算法在参数辨识中的应用进展[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
9 王志宏;王斌;;基于遗传算法的非确定性目标优化[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年
10 王晓东;刘全利;金吉凌;王伟;;基于序次优化策略的改进遗传算法[A];第二十三届中国控制会议论文集(下册)[C];2004年
中国重要报纸全文数据库 前2条
1 林京;《神经网络和遗传算法在水科学领域的应用》将面市[N];中国水利报;2002年
2 高雪娟;协同设计的平台策略[N];中国计算机报;2006年
中国博士学位论文全文数据库 前10条
1 周辉仁;递阶遗传算法理论及其应用研究[D];天津大学;2008年
2 郝国生;交互式遗传算法中用户的认知规律及其应用[D];中国矿业大学;2009年
3 侯格贤;遗传算法及其在跟踪系统中的应用研究[D];西安电子科技大学;1998年
4 马国田;遗传算法及其在电磁工程中的应用[D];西安电子科技大学;1998年
5 唐文艳;结构优化中的遗传算法研究和应用[D];大连理工大学;2002年
6 周激流;遗传算法理论及其在水问题中应用的研究[D];四川大学;2000年
7 刘冀成;基于改进遗传算法的生物电磁成像与磁场聚焦应用研究[D];四川大学;2005年
8 袁丽华;基于物种进化的遗传算法研究[D];南京航空航天大学;2009年
9 李航;遗传算法求解多模态优化问题的研究[D];天津大学;2007年
10 石玉;提高实数遗传算法数值优化效率的研究[D];南京航空航天大学;2002年
中国硕士学位论文全文数据库 前10条
1 谷克;遗传算法在公路路线智能决策系统中的应用研究[D];长安大学;2008年
2 李艳娇;基于改进遗传算法的刚架结构截面力学特性参数优化的研究[D];吉林大学;2009年
3 任巍;求解极小碰集的遗传算法的研究与改进[D];吉林大学;2009年
4 王赫;混沌遗传算法在模式识别中的应用[D];东北电力大学;2009年
5 于蕾蕾;双种群遗传算法的改进及其应用研究[D];合肥工业大学;2009年
6 王婧;遗传算法及其在聚类分析中的应用[D];华中师范大学;2009年
7 胡文斯;基于遗传算法的车间作业调度问题的研究[D];中国海洋大学;2009年
8 吴明华;基于遗传算法的养护机械生产车间作业调度问题的研究[D];长安大学;2007年
9 尉钰;基于改进遗传算法的桥梁模型动力优化[D];长安大学;2007年
10 王银年;遗传算法的研究与应用[D];江南大学;2009年
本文关键词:基于遗传算法的数据挖掘在客户关系管理中的应用研究,由笔耕文化传播整理发布。
,本文编号:471839
本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/471839.html