基于多源数据的贷后风险指标学习与预测
本文关键词:基于多源数据的贷后风险指标学习与预测
更多相关文章: 贷后风险 预测 指标学习 时间窗口 不良样本反馈
【摘要】:信贷业务是商业银行的主要利润来源,贷后风险管理主要由省级和各地市级分行承担,现有贷后风险检测主要依据总行下发的风险指数、信贷客户的财务信息、客户交易等信息,缺少分析信贷客户所在的行业信息等外部数据对风险的影响,而这些因素会影响用户的资金偿还能力。其次,贷后风险指标和评估具有一定滞后性。现有风险指标数据多是选择同比波动检测,指标出现异常时,风险已经发生,带来的损失往往很难挽回,同时对于贷后管理周期的不同阶段处理方式单一,没有体现不同阶段的贷后风险差异。因此,融合更多贷后风险关联数据,对风险指标进行过程化更新和实时学习、优化贷后风险管理流程具有重要意义。针对贷后风险现行指标不能反映信贷客户的行业风险问题,提出了融合多源数据的贷后风险评估框架。结合银行现有指标数据,信贷客户原始数据,以及外部的行业和地区数据,利用多源数据对风险指标进行学习;提出了概率包裹式特征选择方法,对多源数据进行集成特征分析。通过计算外部行业和地区数据的相似度,划分相似行业和地区。选用两个信贷数据集分析验证特征提取的有效性,增加外部数据和补充内部数据,并根据外部行业和地区数据的相似度筛选可疑数据,提高了预测准确率。针对贷后风险预测的滞后性,使用基于时间窗口的动态模型,对贷款的生命周期进行建模,动态选取处于不同信贷阶段的相关数据,依据分类误差学习不同时间窗口在信贷风险分析过程中的权重。针对实际数据集,通过与其他风险预测方法对比,验证时间窗口动态模型的有效性。针对信贷数据样本的不平衡性问题,即不良贷款的样本数量远远小于正常贷款的样本数量使得负样本被覆盖而误分类,进行两方面改进,一是提高不良样本在学习数据集中的占比,通过对确定的异常样本,结合外部数据分析结果筛选相关数据集合;二是建立异常样本动态反馈机制,通过优化货后风险评估流程对不良贷款样本进行迭代分析,利用粒子群优化算法对筛选后的不良样本进行特征学习。针对两个数据集,实验验证数据筛选和反馈机制的效果,通过优化算法学习参数,分析贷后风险预测准确率。
【关键词】:贷后风险 预测 指标学习 时间窗口 不良样本反馈
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F832.4
【目录】:
- 摘要7-9
- ABSTRACT9-11
- 第1章 绪论11-15
- 1.1 研究背景11-13
- 1.2 问题描述13-14
- 1.3 本文工作14
- 1.4 论文结构14-15
- 第2章 融合多源数据的贷后风险评估框架15-21
- 2.1 相关工作15-16
- 2.2 贷后风险管理流程优化16-17
- 2.3 面向贷后风险评估的多源数据融合17-18
- 2.4 基于多源数据的贷后风险评估框架18-21
- 第3章 基于多源数据的贷后风险指标学习21-35
- 3.1 相关工作21-22
- 3.2 基于多源数据的特征选择和有效性分析22-25
- 3.2.1 基本概念22
- 3.2.2 基于信息增益的属性相关性分析22-23
- 3.2.3 概率包裹式特征选择23-25
- 3.3 行业数据和地区数据与贷后风险的关联性分析25-27
- 3.3.1 贷后风险的行业关联性分析25-26
- 3.3.2 地区经济指标的关联性分析26-27
- 3.4 验证分析27-35
- 3.4.1 数据集描述27-28
- 3.4.2 数据预处理28-29
- 3.4.3 指标有效性分析29-35
- 第4章 基于滑动时间窗口的贷后风险预测模型35-43
- 4.1 信贷周期性模式分析35
- 4.2 相关工作35-37
- 4.3 基于平滑移动窗口的贷后风险预测37-40
- 4.3.1 风险预测学习器37
- 4.3.2 基于滑动窗口的风险预测模型37-40
- 4.4 实验40-43
- 第5章 基于不良样本反馈机制的贷后风险预测43-50
- 5.1 相关工作43-44
- 5.2 不良数据样本的动态反馈分析44-46
- 5.2.1 基于不良样本的数据筛选44-45
- 5.2.2 基于粒子群的特征重要性优化45-46
- 5.3 实验46-50
- 第6章 总结与展望50-52
- 6.1 本文总结50-51
- 6.2 未来工作51-52
- 参考文献52-55
- 致谢55-56
- 攻读硕士学位期间参与的项目56-57
- 附件57
【相似文献】
中国期刊全文数据库 前1条
1 陈伟清;刘彦花;;城市规划多源数据整合与数据库建设[J];广西大学学报(自然科学版);2009年01期
中国重要会议论文全文数据库 前10条
1 廖邦固;韩雪培;;多源数据的空间坐标变换方法探讨[A];认识地理过程 关注人类家园——中国地理学会2003年学术年会文集[C];2003年
2 武坚;李崇伟;胡建军;李相全;;基于多源数据的无图区地形图生产研究[A];2009全国测绘科技信息交流会暨首届测绘博客征文颁奖论文集[C];2009年
3 陈伟清;刘彦花;;城市规划多源数据整合与数据库建设[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
4 刘海砚;李少梅;肖强;;综合利用多源数据更新基础地理信息的技术与方法[A];中国地理信息系统协会第三次代表大会暨第七届年会论文集[C];2003年
5 单新建;叶洪;;星载SAR图像与多源数据融合在地质构造识别中的应用[A];中国地震学会第七次学术大会论文摘要集[C];1998年
6 杨锋杰;卢燕;杨振毅;宋翠玉;;多源数据融合的方法与应用[A];山东地球物理六十年[C];2009年
7 陈芸芝;陈崇成;汪小钦;凌飞龙;;多源数据在森林资源动态变化监测中的应用[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
8 胡洁;高庆方;李辉;王新福;;多源数据集成技术探讨[A];中国测绘学会九届四次理事会暨2008年学术年会论文集[C];2008年
9 胡洁;高庆方;李辉;王新福;;多源数据集成技术探讨[A];第十届中国科协年会论文集(一)[C];2008年
10 林丽姝;季晓燕;蒋捷;;多源数据中的居民点一致性匹配技术研究——以全球基础地理底图数据库的建立为例[A];中国地理信息系统协会第九届年会论文集[C];2005年
中国博士学位论文全文数据库 前3条
1 张涛;基于多源数据的高速公路网络脆弱性分析[D];哈尔滨工业大学;2015年
2 刘长东;海洋多源数据获取及基于多源数据的海域管理信息系统[D];中国海洋大学;2008年
3 李华朋;基于证据推理的多源数据湿地空间分类知识发现研究[D];中国科学院研究生院(东北地理与农业生态研究所);2012年
中国硕士学位论文全文数据库 前10条
1 安艳召;基于多源数据的单点过饱和动态信号控制研究[D];昆明理工大学;2015年
2 姬龙建;基于多源信息的煤炭储量管理系统的设计与实现[D];中国矿业大学;2015年
3 马李立;基于多源数据转换的土地定级估价系统设计[D];复旦大学;2013年
4 赵永亮;基于时空的多源数据趋势预测研究[D];电子科技大学;2014年
5 王杰;基于多源数据的矿区空间变化监测与分析[D];华北理工大学;2015年
6 黎明;面向多源数据的雷电预警方法研究及平台设计[D];成都信息工程学院;2014年
7 赵延芳;基于多源数据融合的冲沟参数提取研究[D];鲁东大学;2016年
8 宋力;考虑多源数据集的交通状态估计方法研究[D];北京理工大学;2016年
9 刘云飞;移动GIS中多源数据的集成研究[D];北京林业大学;2016年
10 谭梦甜;基于多源数据的贷后风险指标学习与预测[D];山东大学;2016年
,本文编号:679193
本文链接:https://www.wllwen.com/guanlilunwen/bankxd/679193.html