当前位置:主页 > 管理论文 > 信贷论文 >

应用决策树构建个人住房贷款风险评估模型

发布时间:2017-05-23 10:16

  本文关键词:应用决策树构建个人住房贷款风险评估模型,由笔耕文化传播整理发布。


【摘要】: 本文主要运用数据挖掘中的决策树技术对经过预处理后的个人住房贷款挖掘数据集中的数据进行分析,发现隐藏在大量数据中的隐含模式,最终得到个人住房贷款风险评估模型。本文研究的内容主要包括数据采集、数据预处理以及模型的建立,而这三部分又是基于数据挖掘以及决策树的相关理论,根据业务需求并按照数据挖掘工作的一般步骤展开的。 论文针对我国商业银行信贷资产质量低下和风险加大的客观情况,借鉴外资银行应用数据挖掘决策树技术建立客户信用评价系统的成功经验,在明确挖掘目的的前提下,深入理解数据挖掘、决策树、数据采集、数据预处理、聚类分析以及模型评价等方面的相关概念。在此基础上,结合本文研究的问题以及数据的特点,通过各种方法的分析与比较,用适合的数据采集和预处理方法对数据库中的一半数据进行处理,建立适合挖掘的数据集,应用决策树C4.5算法以及聚类k-平均算法对这些数据进行挖掘和分析,通过计算风险度量值和决策影响程度值,确定每个属性各个取值的分数值,得到个人住房贷款风险评估模型。最后使用剩余的一半数据作为测试样本来评价这个模型,证明此模型具有较强的预测能力,是当前商业银行可以采用的最优模型,值得在实践中推广。 具体来说,本文的研究内容主要有以下几个方面: 1.针对我国个人住房贷款违约率上升的现象,借鉴国外银行取得的成果,提出使用数据挖掘决策树技术构建个人住房贷款风险评估模型将会给商业银行带来很多直接效益。 2.通过数据挖掘分类算法的比较,选择决策树技术以及经典的C4.5算法作为本研究使用的算法,,并介绍其基本理论。 3.依据数据挖掘步骤,明确挖掘目的,以某商业银行个人信贷数据为分析对象,分析研究个人住房贷款原始数据库的数据,通过随机序列发生器,从中随机抽取一半数据作为本研究的样本数据,得到个人住房贷款处理数据集,为数据挖掘后续步骤奠定数据基础,另外一半将被用来测试。 4.兼顾数据质量和计算效率,对一些重要的预处理方法深入地研究和实践,选择较为完善的预处理方法对个人住房贷款处理数据集进行了一系列的处理,得到适合挖掘的个人住房贷款挖掘数据集。 5.在数据挖掘及决策树理论的指导下,使用决策树分类技术和聚类技术,应用C4.5算法计算信息增益率创建决策树,在此基础上,计算风险度量值和决策影响程度值得到个人住房贷款风险评估模型,进而通过聚类k-平均算法划分风险评估等级。 6.使用原始数据库中的另一半数据对个人住房贷款风险评估模型进行测试和评价,证明其预测准确率较高,稳健性好,易于理解,效率高,推广能力强。
【关键词】:决策树 个人住房贷款 风险评估 数据预处理 数据挖掘
【学位授予单位】:东北财经大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:F832.4;F224
【目录】:
  • 摘要2-4
  • ABSTRACT4-8
  • 第1章 绪论8-13
  • 1.1 课题背景及选题意义8-10
  • 1.2 数据挖掘决策树技术在国内外银行信贷业务的应用现状10-11
  • 1.3 本文的研究方法及内容11-13
  • 第2章 数据挖掘的基本理论13-22
  • 2.1 数据挖掘的定义13-14
  • 2.1.1 技术角度的定义13
  • 2.1.2 商业角度的定义13-14
  • 2.2 数据挖掘的作用及功能14-15
  • 2.3 数据挖掘的一般过程及具体应用15-17
  • 2.3.1 数据挖掘的一般过程15-16
  • 2.3.2 个人住房贷款数据挖掘的过程16-17
  • 2.4 数据挖掘的方法与选择17-22
  • 2.4.1 传统统计分析18
  • 2.4.2 神经网络技术18-19
  • 2.4.3 决策树方法19-20
  • 2.4.4 数据挖掘方法的选择20-22
  • 第3章 决策树的基本理论22-31
  • 3.1 决策树的基本概念22-23
  • 3.2 决策树算法及选择23-26
  • 3.2.1 ID3算法23-24
  • 3.2.2 C4.5算法24-26
  • 3.2.3 算法比较与选择26
  • 3.3 决策树的构造26-31
  • 3.3.1 决策树生成的操作过程26-28
  • 3.3.2 决策树的生长28-29
  • 3.3.3 C4.5算法决策树的修剪29
  • 3.3.4 C4.5算法规则提取29-31
  • 第4章 数据准备31-44
  • 4.1 数据采集31-32
  • 4.1.1 数据采集方法31-32
  • 4.1.2 数据采集结果32
  • 4.2 数据预处理32-44
  • 4.2.1 数据预处理的必要性32-34
  • 4.2.2 数据预处理的内容和方法34-42
  • 4.2.3 数据预处理的结果42-44
  • 第5章 个人住房贷款信用风险评估模型的建立44-56
  • 5.1 决策属性信息增益率的计算44-47
  • 5.2 依据 C4.5算法构造决策树47-48
  • 5.3 基于决策树构建风险评估模型48-50
  • 5.4 聚类分析确定风险评估等级50-54
  • 5.4.1 聚类的概念以及k-平均算法50-52
  • 5.4.2 确定风险评估等级52-54
  • 5.5 模型评价54-56
  • 第6章 总结与展望56-58
  • 参考文献58-62
  • 后记62-63

【引证文献】

中国期刊全文数据库 前1条

1 潘浩;蔺莉;;基于决策树的毕业生课程优化算法设计[J];信息技术;2010年08期


  本文关键词:应用决策树构建个人住房贷款风险评估模型,由笔耕文化传播整理发布。



本文编号:387637

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/bankxd/387637.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a7504***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com