基于改进K-means算法的客户购买投资理财产品的行为分析
发布时间:2023-05-20 01:05
对客户的分析对于各行各业都是十分重要的,能够准确的将客户划分为对应的群体并进行深度的挖掘分析是十分关键的。其中,K-means算法经常被应用在客户细分中。操作简单、原理易懂是K-means的优点,但聚类结果很容易受初始点、孤立点以及噪声的影响,且该算法还要提前提供K值。故本文在其缺点上提出了相应的改进,其改进思路是:利用改进的UPGMA算法筛选出候选中心点,然后将筛选出的候选中心点作为最大最小距离算法的输入数据,由于最大最小算法中需要用到参数θ,故本文采用分冶思想将θ所属的区间分解成多个较小的区间,并利用属性离散化对θ进行处理,接着利用BWP指标函数结果进行评价,将BWP指标按照由大及小取95%指标平均值作为最佳聚类数。该算法很好的解决了上述提到传统K-means存在的问题。为了验证该算法的有效性,本文选取了Iris,Glass和New-thyroid三个库,并分别用不同的聚类算法进行分析,结果显示本文的改进点可行。论文选取江西省南昌市农商银行部分购买投资理财产品e百福的客户作为研究对象,在实验上分别用改进的算法、传统K-means算法以及基于最大最小距离算法对比实验,利用实验表明改进...
【文章页数】:50 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 论文的研究背景以及意义
1.2 研究现状分析
1.2.1 K-means聚类算法的研究现状
1.3 银行投资理财现状分析
1.3.1 投资理财兴起
1.3.2 银行个人理财产品的国内外现状
1.4 论文安排
2 数据挖掘中的聚类分析
2.1 数据挖掘技术
2.1.1 数据挖掘的定义
2.1.2 数据挖掘面临的主要问题
2.2 聚类分析概述
2.3 主要的聚类方法
2.3.1 基于划分的方法
2.3.2 基于层次的方法
2.3.3 基于密度的方法
2.3.4 基于模型的方法
2.3.5 基于网格的方法
2.4 聚类分析中的数据结构、数据类型、相似性度量
2.4.1 聚类分析中的数据结构
2.4.2 聚类分析中的数据类型
2.4.3 聚类分析中的相似性度量
2.5 聚类准则函数
2.6 本章小结
3 K-means聚类算法分析
3.1 K-means聚类算法的基本步骤
3.2 K-means聚类算法示意图
3.3 K-means聚类算法的流程
3.4 现阶段K-means聚类算法的优缺点分析以及改进
3.4.1 现阶段K-means算法的优缺点分析
3.4.2 针对现阶段K-means算法缺点提出的改进方法
3.5 现阶段K-means算法中给定K值方法
3.6 现阶段初始中心点的选取方法
3.7 本章小节
4 改进的UPGMA与最大最小距离相结合的改进K-means算法
4.1 UPGMA算法
4.1.1 UPGMA算法思想
4.1.2 UPGMA算法具体执行描述
4.1.3 UPGMA算法的优劣势以及改进
4.2 最大最小距离算法
4.2.1 最大最小距离算法思想
4.2.2 最大最小距离算法优缺点分析
4.3 连续属性离散化
4.4 分冶算法
4.5 BWP指标函数
4.5.1 BWP指标函数的定义
4.5.2 通过BWP指标函数确定K值
4.6 改进后的K-means聚类算法
4.7 仿真实验与结果分析
4.7.1 数据集
4.7.2 实验设计
4.7.3 聚类结果及分析
4.8 本章小结
5 改进后的K-means算法在投资理财方面的客户行为分析
5.1 购买理财客户细分背景及意义
5.2 数据准备及预处理
5.3 模型的建立与实现
5.3.1 所用的软件介绍
5.3.2 数据加载
5.3.3 数据的量化
5.4 K-means聚类客户细分
5.4.1 k-means算法聚类数的确定
5.4.2 聚类过程及结果
5.4.3 聚类客户特征提取
5.5 基于最大最小距离的k-means聚类客户细分
5.6 基于改进后的k-means聚类客户细分
5.6.1 改进后聚类过程及结果
5.6.2 改进后聚类客户特征提取
5.7 不同聚类结果比较及营销策略制定
5.7.1 聚类结果比较
5.7.2 营销策略制定
5.8 本章小结
结论
致谢
参考文献
本文编号:3820238
【文章页数】:50 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 论文的研究背景以及意义
1.2 研究现状分析
1.2.1 K-means聚类算法的研究现状
1.3 银行投资理财现状分析
1.3.1 投资理财兴起
1.3.2 银行个人理财产品的国内外现状
1.4 论文安排
2 数据挖掘中的聚类分析
2.1 数据挖掘技术
2.1.1 数据挖掘的定义
2.1.2 数据挖掘面临的主要问题
2.2 聚类分析概述
2.3 主要的聚类方法
2.3.1 基于划分的方法
2.3.2 基于层次的方法
2.3.3 基于密度的方法
2.3.4 基于模型的方法
2.3.5 基于网格的方法
2.4 聚类分析中的数据结构、数据类型、相似性度量
2.4.1 聚类分析中的数据结构
2.4.2 聚类分析中的数据类型
2.4.3 聚类分析中的相似性度量
2.5 聚类准则函数
2.6 本章小结
3 K-means聚类算法分析
3.1 K-means聚类算法的基本步骤
3.2 K-means聚类算法示意图
3.3 K-means聚类算法的流程
3.4 现阶段K-means聚类算法的优缺点分析以及改进
3.4.1 现阶段K-means算法的优缺点分析
3.4.2 针对现阶段K-means算法缺点提出的改进方法
3.5 现阶段K-means算法中给定K值方法
3.6 现阶段初始中心点的选取方法
3.7 本章小节
4 改进的UPGMA与最大最小距离相结合的改进K-means算法
4.1 UPGMA算法
4.1.1 UPGMA算法思想
4.1.2 UPGMA算法具体执行描述
4.1.3 UPGMA算法的优劣势以及改进
4.2 最大最小距离算法
4.2.1 最大最小距离算法思想
4.2.2 最大最小距离算法优缺点分析
4.3 连续属性离散化
4.4 分冶算法
4.5 BWP指标函数
4.5.1 BWP指标函数的定义
4.5.2 通过BWP指标函数确定K值
4.6 改进后的K-means聚类算法
4.7 仿真实验与结果分析
4.7.1 数据集
4.7.2 实验设计
4.7.3 聚类结果及分析
4.8 本章小结
5 改进后的K-means算法在投资理财方面的客户行为分析
5.1 购买理财客户细分背景及意义
5.2 数据准备及预处理
5.3 模型的建立与实现
5.3.1 所用的软件介绍
5.3.2 数据加载
5.3.3 数据的量化
5.4 K-means聚类客户细分
5.4.1 k-means算法聚类数的确定
5.4.2 聚类过程及结果
5.4.3 聚类客户特征提取
5.5 基于最大最小距离的k-means聚类客户细分
5.6 基于改进后的k-means聚类客户细分
5.6.1 改进后聚类过程及结果
5.6.2 改进后聚类客户特征提取
5.7 不同聚类结果比较及营销策略制定
5.7.1 聚类结果比较
5.7.2 营销策略制定
5.8 本章小结
结论
致谢
参考文献
本文编号:3820238
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/3820238.html