基于数据挖掘的客户忠诚度分析
发布时间:2017-10-05 13:29
本文关键词:基于数据挖掘的客户忠诚度分析
更多相关文章: 知识发现 数据挖掘 分类 预测 回归 聚类 客户忠诚度
【摘要】:数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,,提供决策支持。分类和预测是数据挖掘中的重要研究方面,可以用于提取描述重要数据类的模型或预测未来的数据趋势。经过近20年的发展,数据挖掘技术在理论研究上日趋成熟,正不断的扩展其应用范围,当前数据挖掘已用于电信、金融、商业、气象预报、DNA、股票市场、入侵检测和客户分类等许多领域。 本文就分类分析和预测分析算法进行了深入研究,对相关算法作了改进;在此基础上,对客户忠诚度变化趋势进行了预测分析。 首先研究了分类分析和预测分析的相关算法,重点探讨了线性回归分析和CART分类器的原理,对CART分类算法进行了改进;其次,以线性回归分析和CART分类算法为主并结合其它数据挖掘算法,针对企业中的客户忠诚度分析问题构建了客户忠诚度分析系统,最后,根据海尔客户关系数据,对海尔集团的客户忠诚度进行预测,得出了有效的结果。 论文的主要内容如下: 第一,阐述了课题的研究背景及其重要的研究意义;对当前数据挖掘的国内与国外的研究动态进行分析;通过对知识发现一般过程的介绍,分析了一个典型的数据挖掘系统中各模块的主要功能,并对其中采用的数据挖掘的技术作了详细阐述。 第二,介绍了决策树,贝叶斯网络,神经网络,遗传算法,线性回归等分类和预测的方法,分析比较了其算法的优劣及其适用范围,并讨论了评价分类准确率的方法。 第三,详细讨论了线性回归尤其是多元线性回归算法的基本思路及其参数估计,利用多元线性回归思想构造了趋势预测函数;分析了CART分类器的原理,以及决策树的构建、修剪和验证过程的详细算法描述,并将CART分类算法的建树过程与修剪过程合并,得到了合并算法,从而提高了决策树的执行效率。 第四,完成了客户忠诚度分析系统。描述了客户忠诚度的概念,说明研究客户忠诚度对企业的重要意义;介绍了系统的主要功能:数据预处理、重点客户发现以及客户忠诚度预测;详细讨论了数据预处理模块所采用的预处理手段和方法;通过客户忠诚度分析系统,就海尔集团所提供的相关数据对其客户忠诚度变化趋势进行了预测分析。主要操作包括:针对海尔公司的客户关系数据,选取和处理客户忠诚 摘要 度分析数据:利用原始客户关系数据及趋势预测函数构造客户购买能力变化趋势影 响因子;结合其它影响因子运用分类分析对客户忠诚度的趋势进行预测。该系统通 过在分类分析中导入变化趋势影响因子,打破了以往的客户忠诚度分析系统中对客 户只进行类别上的划分,而不能预测忠诚度变化趋势的局限性。分析结果证明了忠 诚度趋势预测算法(LTPA)的实用性。 最后,对本文的工作进行了总结和对研究前景的展望。
【关键词】:知识发现 数据挖掘 分类 预测 回归 聚类 客户忠诚度
【学位授予单位】:青岛大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP311.1
【目录】:
- 摘要2-4
- Abstract4-8
- 第一章 绪论8-18
- 1.1 选题的背景和意义8-9
- 1.2 国内外研究现状9-10
- 1.3 数据挖掘研究的内容及面临的挑战10-16
- 1.3.1 数据挖掘定义10-11
- 1.3.2 知识发现的一般过程11-12
- 1.3.3 数据挖掘系统架构12-13
- 1.3.4 数据挖掘的分类13-15
- 1.3.5 数据挖掘研究和应用的挑战性15-16
- 1.4 论文的主要内容16-18
- 第二章 分类和预测18-31
- 2.1 什么是分类、预测18-19
- 2.2 决策树基本算法19-21
- 2.2.1 决策树生成算法19-20
- 2.2.2 决策树的修剪20-21
- 2.3 贝叶斯分类21-23
- 2.3.1 贝叶斯定理21-22
- 2.3.2 朴素贝叶斯分类22-23
- 2.4 神经网络预测算法23-24
- 2.5 其他分类方法24-26
- 2.5.1 k-最临近分类24-25
- 2.5.2 基于案例的推理25-26
- 2.5.3 遗传算法26
- 2.6 预测26-29
- 2.6.1 非线性回归26-27
- 2.6.2 其它回归模型27
- 2.6.3 各种回归模型的比较27-29
- 2.7 分类法的准确性29-30
- 2.7.1 评估分类法的准确率29-30
- 2.7.2 提高分类法的准确率30
- 2.8 本章小节30-31
- 第三章 线性回归分析及CART分类器31-48
- 3.1 线性回归分析31-36
- 3.1.1 一元线性回归:31-32
- 3.1.2 多元线性回归32-33
- 3.1.3 p元线性回归模型中的参数估计33-35
- 3.1.4 趋势预测函数35-36
- 3.2 CART分类器36-46
- 3.2.1 决策树建立36-40
- 3.2.1.1 属性向量的标准问题集38-39
- 3.2.1.2 CART决策树构建的过程39
- 3.2.1.3 决策树建树算法描述39-40
- 3.2.2 决策树修剪40-42
- 3.2.2.1 基本定义40
- 3.2.2.2 修剪决策树的过程40-42
- 3.2.2.3 确定叶节点的类别42
- 3.2.3 决策树验证42-44
- 3.2.3.1 测试样例验证42-43
- 3.2.3.2 交叉验证43-44
- 3.2.4 CART建树与修剪的合并44-46
- 3.2.4.1 MDL修剪45
- 3.2.4.2 建树与修剪合并算法45-46
- 3.3 本章小结46-48
- 第四章 基于海尔客户关系数据的客户忠诚度分析系统48-59
- 4.1 引言48
- 4.2 系统功能简介48-49
- 4.3 系统整体构架49
- 4.4 系统模块详细介绍49-51
- 4.4.1 数据预处理模块49-51
- 4.4.2 重点客户发现模块51
- 4.4.3 客户忠诚度预测模块51
- 4.5 基于海尔客户关系数据的忠诚度分析51-58
- 4.5.1 数据的选取52-53
- 4.5.2 影响因子的构造53-55
- 4.5.3 训练集的选取55-56
- 4.5.4 客户忠诚度预测56-58
- 4.6 本章小结58-59
- 第五章 总结与展望59-60
- 5.1 全文的工作总结59
- 5.2 存在的问题及对未来的展望59-60
- 参考文献60-63
- 致谢63
【参考文献】
中国期刊全文数据库 前1条
1 钟晓;马少平;张钹;俞瑞钊;;数据挖掘综述[J];模式识别与人工智能;2001年01期
本文编号:977065
本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/977065.html