基于数据挖掘的电信客户信用分类模型研究
发布时间:2020-06-15 21:05
【摘要】: 当今世界,电信运营商要想在日益激烈的竞争环境下,最大程度的在竞争活动中立于不败之地,不仅要对客户提供优质的服务,更重要的是要了解运营商提供的产品与所服务的客户结构是怎样的。在经营活动中,客户的信用等级正好可以反映客户结构的基本信息,指导电信公司在具体的管理实践中采取积极有效地措施,从而减少其信用风险,降低运营成本,提高经济效益,产生巨大的社会效应。 正确有效地评估电信客户的信用等级,是当前电信运营商工作地重中之重。本文将以重庆某电信运营商部分后付费手机用户数据为例,利用数据挖掘技术,使用SAS统计分析软件中的数据挖掘模块进行实际的操作分析,最终建立分类模型,将客户的信用等级进行有效分类,并对未来客户的各项属性依据模型进行信用等级的预测。现阶段,该电信运营商主要以客户每月消费金额的大小来给客户分类,然后依据消费金额的大小依次确定该客户的信用等级。该方法显得并不是很准确,为了提高信用等级的预测准确度,本文提出了一种确定信用等级的新方法,通过对本文六个部分的阐述可了解,具体过程如下描述。 首先本文阐明了该研究的基本背景,即电信运营商呆账坏账率较高,给公司带来巨额的损失,同时说明了正确进行信用等级分类可降低信用风险,降低管理成本,提高经济效益这一重要意义;然后,论文第二部分对信用评分评级和数据挖掘的基本知识进行了概述;接着,在第三部分提出了研究的总体思路,即先对原始数据准备阶段的概述,然后运用SOM聚类算法对客户信用等级重新评分评级,确定类标号,接着运用C4.5决策树算法对新数据建立分类模型,并对该模型进行评估、检验其预测效果的优良程度,同时再使用上述相同方法将根据传统经验确定的信用等级类标号作为目标变量重新建立分类决策树,并与之前采用的新方法所得模型进行比较分析,最终确定哪种模型可用,并对所选模型在管理上的应用进行了简要阐述;再则,论文在第四部分是对数据准备过程的具体扩展和详细分析,这将为论文后一部分的研究及数据挖掘工作奠定基础;第五部分是依据论文第三部分所提出的研究思路,结合该电信运营商的实际案例进行分析,并通过在SAS软件数据挖掘模块中实现了数据挖掘的全过程,将各分析流程、评估指标、模型结果以图形化方式直观的展现出来,同时对该模型结果在信用管理和营销管理两方面的应用进行了叙述;最后,论文的第六部分阐述了论文的基本成果和所存在的不足,为电信运营商在今后的工作中改进思路提供了借鉴意义。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:F623;F224
【图文】:
图 4.1 10 月份数据分布Fig.4.1 data distribution in October们可知,大部分数据集中在 0-870 元左右,而有少部分此为了减少个别大额数据给数据分析、建模产生不必要消费金额的部分数据以如图 4.3 方法来处理。图 4.3 10 月分箱图Fig.4.3 binning in october
图 4.3 10 月分箱图Fig.4.3 binning in october月份消费金额的分箱处理,我们可以针对其他月份或属性的具体情况进行数据处理。集成式将来自不同数据源的数据整合成一致的数据存储。突检测和语义异种性的解析都有助于数据集成。本文据库的不同表单而来,为了统一整合数据,并消除冗金额和年龄等冗余信息统一归类,只取一次;并将不信息的属性改为相同名字处理,如“年龄”和“age”统一变换化
本文编号:2714995
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:F623;F224
【图文】:
图 4.1 10 月份数据分布Fig.4.1 data distribution in October们可知,大部分数据集中在 0-870 元左右,而有少部分此为了减少个别大额数据给数据分析、建模产生不必要消费金额的部分数据以如图 4.3 方法来处理。图 4.3 10 月分箱图Fig.4.3 binning in october
图 4.3 10 月分箱图Fig.4.3 binning in october月份消费金额的分箱处理,我们可以针对其他月份或属性的具体情况进行数据处理。集成式将来自不同数据源的数据整合成一致的数据存储。突检测和语义异种性的解析都有助于数据集成。本文据库的不同表单而来,为了统一整合数据,并消除冗金额和年龄等冗余信息统一归类,只取一次;并将不信息的属性改为相同名字处理,如“年龄”和“age”统一变换化
【参考文献】
相关期刊论文 前10条
1 程建;连玉君;;信用评分系统的建模及其验证研究[J];国际金融研究;2007年06期
2 史学勇,李元;信用评级的方法[J];广州大学学报(自然科学版);2004年06期
3 张颖;数据挖掘技术在银行CRM中的应用[J];广西金融研究;2004年02期
4 吴金星,王宗军;基于层次分析法的企业信用评价方法研究[J];华中科技大学学报(自然科学版);2004年03期
5 李萌;Logit模型在商业银行信用风险评估中的应用研究[J];管理科学;2005年02期
6 王实,高文,李锦涛,谢辉;路径聚类:在Web站点中的知识发现[J];计算机研究与发展;2001年04期
7 方洪全,曾勇,何佳;多标准等级判别模型在银行信用风险评估中的应用研究[J];金融研究;2004年09期
8 郭莹,张晓燕;数据仓库和数据挖掘技术在银行客户关系管理中的应用[J];科技管理研究;2003年02期
9 杨力;宋利;侯峰;;信用评分的统计模型方法述评[J];统计与决策;2006年13期
10 朱晓明;刘治国;;信用评分模型综述[J];统计与决策;2007年02期
相关硕士学位论文 前3条
1 李凡;数据挖掘技术的研究与应用[D];西安电子科技大学;2002年
2 文专;基于神经网络的分类数据挖掘属性选择和规则抽取研究[D];天津大学;2004年
3 张应武;大唐电信信用风险管理体系的建设与实施[D];西北大学;2003年
本文编号:2714995
本文链接:https://www.wllwen.com/jingjilunwen/xxjj/2714995.html