当前位置:主页 > 论文百科 > 研究生论文 >

聚类分析在 H 银行客户分类中的应用

发布时间:2016-07-26 17:21

第一章   绪论


1.1 研究背景和选题意义

随着网络技术和数据库技术的成熟,银行所提供的网上银行服务也越来越多元化,除了能在线购买银行产品外,还能使用网上银行所提供的转账服务。这种商业模式在逐步向电子化转变的同时,也为客户带来了更加方便的交易模式和更多的选择,除此之外,同时可以让银行真正了解到客户的服务需要与投资的行为特征,提供了强有力的支持。而数据挖掘技术,则是银行在电子商务领域中必不可少的重要工具,它能够为银行营运者做出适当的营销策略,创造更多银行利润提供数据支持和指导方向,是银行电子商务中尤为重要的、不可或缺的应用技术。除此之外,由于数据库和网络技术的飞速发展,银行收集了大量而且不同类型的数据,这些数据包括有客户的基本信息、交易纪录、以及产品的基本信息等等数据。为了能够给银行带来更多的利润,银行必须要将这些收集到的数据,转化成为对银行经营生产有帮助的信息,于是在这样的一个转化过程中,数据挖掘的概念油然而生。数据挖掘技术经过了多年的发展及演变,其技术不断在丰富,数据挖掘技术包括了聚类分析法、关联规则、决策树和神经网络等技术,而这些技术现在已经应用在不同的科学领域中,还获得了不错的效果。时至今日,数据挖掘的各种技术与方法都已经应用在银行中去,为银行制定营销策略提供了指导,使得银行不再盲目投放营销资源,给银行的经营带来了良好的效果。

由于信息管理技术和网络技术这些科学技术的高速发展,电子商务在这些技术的刺激下也蓬勃的发展起来且呈现百花齐放的局面。银行除了面对同行的竞争外,还要面对一些新兴的电子商务平台所带来的冲击,例如支付宝、财付通等第三方支付平台。银行同行之间,以及和电子商务平台之间的竞争变得越来越激烈。在以前商业模式下多数银行都是通过发行不同的产品,通过这样的方式来吸收客户提高客数量,以此达到提高经济效益的目的。然而,银行提供的金融产品最大的特点就是同质性,不同的银行之间的金融产品没有太大差别。但是不同的客户他们的需求都是具有异质性的,银行要想留住客户就只能够改变现有的经营理念。

本文以 H 银行网上转账系统的客户分类项目为具体案例,针对该项目的特定需求,利用数据挖掘技术中的聚类分析法,设定相关变量,运用 SPSS 软件进行检验分析。将付费客户按指定变量进行分类,并锁定分类后的部分特征明显的客户群体,制定有针对性的营销方案,促进付费客户的增长。

......................


1.2 国内外研究现状

知识发现 (Knowledge discovery in Database, KDD)与数据挖掘(Data Mining, DM)是数据库领域中重要的课题之一。知识发现 KDD,这个词是一九八九年八月,一个在美国召开的学术会议上所产生的。另外,数据挖掘技术在一九九五年召开的学术会议上,被正式划分成在科研领域的知识发现以及在工程领域的数据挖掘。而在此后数据挖掘技术不断发展,针对它的研究也获得了有效的成绩。现在,主要从三个方面去对知识发现进行研究与探索,它们其中包括原理、技术与应用。多种理论与方法的合理整合是大多数研究者采用的有效技术。

随着时代的发展,数据挖掘在电子商务各个领域上的使用情况日益普及。例如在金融行业或零售行业中,它能广泛应用在客户细分、客户开拓、客户挽留、差别化服务和资源投放等等方面。辟如零售业的应用领域,亚马逊就是其中数据挖掘的应用平台。由于在日常的零售业务中,它能够获得大量的零售数据,而这些数据都是能够反映客户的购买特征和购买需要,而通过利用数据挖掘去分析这一类的数据,便能够准确地找出那些有价值的客户并且能够了解他们的购买模式,从而判断出客户的购买趋势,制定有针对性的营销策略。

而在银行方面,则主要侧重于客户关系模式的应用,许多知名软件提供商都有自己银行业数据挖掘解决方案,如:SYSBASE、ORACLE、IBM SPSS等。通过软件商提供的数据挖掘解决方案,银行可以把客户进行分类,实行差别化服务。这些都是对于数据挖掘应用的体现。

就目前国内的情况来看,虽然大部分企业都开始认识到要利用数据挖掘去指导企业营销方向,但由于我们的数据挖掘技术发展比国外要慢,而且没有国外的成熟,加上很多企业系统建立已久,都不是面向数据挖掘的,它跟真正的数据挖掘应用还存在一大段的距离。在这样的情况下,企业要想真正的利用数据挖掘技术为其带来好处,则必须要建立集中式数据存储的数据仓库,才能够充分享受数据挖掘所带来的效果。

....................


第二章  聚类分析法的应用研究


2.1 数据挖掘方法的研究与分析

2.1.1 聚类分析同类方法的比较与分析

聚类是把大量的数据样本按照指定的参数变量进行划分并把数据样本中类似的数据归为一类,而不同类别之前的数据样本是不类似的。数据样本之间是否相似是按照选定的数据指标参数来衡量,而数据样本间的相似度我们可以用距离来表示。聚类的过程其实可以简单理解为逐步合并类的过程,首先每一个数据样本都归为一类,然后将相似度最高也就是距离最短的数据样本合并成一类,,然后再与其它类进行合并。如此反复,则每一次合并,其类别的个数都会减少一个,直到所有样本数据都合并成为一个类,不过如果只合并为一类就会使聚类失去了意义,所以当所有数据样本聚类到某一水平的时候,便可以停止继续合并。而这个时候得到的类别就是聚类分析的结果。

当聚类分析具体应用到客户分类中的时候,我们可以将不同的账户日均余额、转帐总金额、客户年龄等的指标加以表现。那么用数学符号就可以将客户分类表示如下:

聚类分析在 H 银行客户分类中的应用

.........................


2.2 聚类分析技术的应用研究

2.2.1 聚类分析的典型应用场景

对于银行的营运团队来说聚类分析的典型应用场景是十分的广泛,他们几乎每次的营销活动也需要使用到。例如,把银行客户按照指定的维度僻如有客户的利润贡献、客户账户的日均余额、客户类型以及客户的年龄等去进行聚类细分,从而把客户细分成不同的群体。假如将客户分成两上个群体,其中一个群体占总数的 70%,年龄在 27 岁左右,他们对银行的贡献不大,但是他们却经常购买和使用银行服务;另一个群体只占总数的 30%,这个群体的年龄大概在 45 岁左右,他们使用银行服务不多但是贡献却是最大。对于这两类的客户群体,他们都是银行的目标群体,但银行在制定营销策略时就应该有不同。对于第一个群体来说,虽然他们贡献不大,但从他们购买银行产品和使用银行服务的频率来看,这类群体表现出极其忠诚,而忠诚的客户对于银行来说是非常宝贵的财产。所以,对于这个群体银行应该是要密切关注,防止客户流失,并进一步分析这个群体的其它特征,逐步把他们向高价值客户转变。而另一个群体虽然贡献比较大,但由于他们使用银行的产品和服务频率较低,表现出其忠诚度不高,所以对于这个群体营运的重点是积极地向他们介绍合适的银行产品与服务,以此来提升他们对银行的忠诚度。由于这类群体的年龄在 45 岁左右,因此运营团队也会根据这一特点去设计和制定相应的营销策略。

从上面的一个普通案例可以看出,聚类分析其实就是按照一定的指标来将目标的群体进行不同类别的划分,而这种类别划分往往就是银行精细化营运,差别化服务的重要手段。因为只有通过分类分析,才能找出不同群体间的差别与其各自的特征,才能为营销策略提供指导方向。

除了上述的应用场景外,聚类分析在数据化运营的实践中还有以下比较常见的业务应用场景:

目标客户的群体分类:根据业务发展需要筛选出合适的指标变量来对客户群体实行聚类分析,把那些具有明显特征的目标客户群体挑选出来,然后针对这些目标户群体制定不同营销策略与方针,实现差别化、个性化服务,提升银行的营运效果。

不同产品的价值组合:银行除了能够对客户进行聚类之外,还可以对其自身设计的产品进行聚类分析。通过把不同的产品按照特定的指标变量进行聚类,将看似没有关联的产品组合起来,实现交叉销售。

发现孤立点和异常值:在聚类的过程中,有时候会发现有些数据样本的行为特征和整体数据样本的行为特征极不相似。通常我们会把这种数据样本剔除掉,但其实这样的数据样本价值也非常重要。它可以发现在日常业务中一些特殊的,为银行的风险管理带来参考意义。

.....................


第三章    H 银行客户分类现状及解决方案 ............. 14

3.1 H 银行客户分类项目背景 ....................... 14

3.2 H 银行客户分类项目需求分析 ........................ 14

第四章  聚类分析在客户分类中的应用 ............... 21

4.1 聚类分析指标体系的建立 .................. 21

4.1.1  银行客户分类聚类分析指标系统 .................... 21

4.1.2 H 银行客户分类指标建立 .................. 22


第四章  聚类分析在客户分类中的应用


4.1 聚类分析指标体系的建立

4.1.1 银行客户分类聚类分析指标系统

利用聚类分析,首先要对研究的对象进行分类,然后再量化分析与研究,所以要先建立相应的评价指标。至于怎么去选取有效的信息去建立指标体系,必须要根据业务逻辑推测和业务经验判断,决不能随便去选择变量指标,否则会严重损害聚类的效果,使得聚类失去意义。对于银行客户的分类,影响的因素有很多,例如客户的存款、理财总值、负债、甚至客户的性别、年龄等,都能够影响分类的结果。如下图 4-1 所示,该图概括了比较银行行业里比较常用的客户分类指标变量。

聚类分析在 H 银行客户分类中的应用

......................


结论与启示

聚类分析是数据挖掘领域中一项重要的研究课题,它能作为单独的工具以发现数据源数据的分布信息,是对客户分类的一种有效手段。本文正是通过对聚类算法的分析研究,将其应用于 H 银行客户分类项目中,为银行筛选出有价值的客户群体,并将分类结果应用于市场营销中,为企业制定营销计划、实现数据化运营提供了非常有价值的实践。

1.  本文的主要工作:

1)  研究了聚类分析算法的概念,对聚类分析算法进行了深入研究,对聚类分析算法的应用进行了研究。

2)  系统介绍了聚类分析中常用的聚类算法,分析了各自的优缺点以及适用条件,为人们快速准确地找到适合特定领域的聚类算法提供了参考。

3)  重点研究聚类分析法中的系统聚类算法,并把该算法应用于 H 银行客户分类项目中。本文用于聚类的数据是银行客户数据,着重讨论了如何建立数据市集、对数据进行预处理、异常数据的处理和分类指标体系的建立。并对客户分类的全过程进行了详细的论述。

4)  分析论证聚类的结果,并对聚类算法筛选出的有价值客户群体进行定向推广。分析实行定向推广后的付费客户增长率,验证聚类算法在市场营销中的适用性。

2.  今后的研究计划:

1)  现有的聚类算法在研究还需要继续深入。在数据挖掘的理论和实践中,人们已经提出许多聚类算法,但每一种的算法都有某种优点但同时也存在着某些不足,可能适于用处理某类问题却无法处理另一类情况,没有一种聚类算法可以适用于全部情况。

2)  就聚类分析的对象而言,本文仅针对网上转账系统中的客户进行分类,聚类指标变量选取有一定的局限性,在今后在研究中,应考虑客户在银行中的其它属性,使聚类的指标变量更全面,聚类结果更加真实有效。

3)  本文应用的聚类算法只实现了二维空间上的聚类,通过参考相关资料和前人经验,聚类还能实现高维空间聚类,如何利用这种高维聚类算法,也是今后的主要任务之一。

参考文献(略)




本文编号:75992

资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/lwfw/75992.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户defcd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com