基于集成学习的个人信贷决策模型的设计与实现
发布时间:2022-01-05 13:47
随着我国市场经济体制的不断完善,越来越多的个人逐渐接纳个人信贷这种消费模式,个人信贷在银行贷款业务中所占的份额也不断上升。但是由于个人信用的缺失,个人信贷的风险也逐渐凸显。个人信贷违约对银行信贷业务造成了严重的冲击,成为银行迅速发展壮大的阻碍。如何有效的预测借贷人是否能够如期还款对于商业银行具有重要的意义。本文通过分析个人信贷业务的需求,结合现有系统开发工具,设计并实现了以集成学习算法为基础的个人信贷决策系统。本文设计实现的个人信贷决策系统包括个人信贷评估模块、数据库模块和系统管理界面三个部分。其中个人信贷评估模块采用当前主流的集成学习算法,使用支持向量机、随机森林、XGBoost、Light GBM四个模型作为基学习器,通过相对多数投票的方式进行模型融合,得到个人信贷决策模型,该模块同时完成客户信用指标的提取、数据预处理、标准化等数据处理操作,最后使用面向对象的设计方式对个人信贷决策模型进行封装,对外提供统一的调用接口。数据库模块主要包括员工信息表、客户信息表、模型预测结果存储表、模型超参数调优表的设计。系统操作界面采用基于C/S架构的Java Swing技术为个人信贷决策系统的使用...
【文章来源】:郑州大学河南省 211工程院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
Bagging基本原理
3 个人信贷决策模型的设计与构建估指标的选择必须综合考虑各方面的因素,从不同的角度评估借贷客户违约的可能性。本文在分析了国外具有代表性的商业银行的评估指标后,结合国内商业银行的评估指标,将个人信用评估指标分为个人指标、社会指标、经济指标三大类。其中社会指标主要指借贷客户以往的个人信用记录,这部分的指标主要反映借贷人偿还贷款的主观意愿;经济指标主要包括个人年收入、当前的负债状况等,这部分指标主要反映客户当前的还款能力;个人指标包括工龄、受教育程度、年龄等,这部分指标是个人信用风险评估的基本指标[34]。在考虑了个人信用评估指标的科学性和可获取性后,下图给出了本文构建个人信贷决策模型时所选择的个人信用评估指标。
主观意愿这三个部分对应于经过特征提取后,个人信贷决策模型输入征信息,共 21 维信用评价指标。在参考了国外先进银行对个人信用评并结合我国商业银行业务模式后,将其中部分个人信用评估指标进行工作单位细分为国家党政机关、事业单位、国有企业、私营企业、个体户受教育程度细分为硕士研究生及以上、大学本科、大专、高中(中专)、;婚姻状况细分为已婚、未婚、离异、丧偶;申贷时陪同人员细分为无家人、同事、其他。经过特征提取后的个人信用评估指标构成了个人信型的输入,下面将对这部分特征进行处理。 数据预处理个人信用评估指标中,存在着职业、是否有车、受教育程度、是否有房况、申贷时陪同人员、性别等离散型数据,对这些数据需要进行量化处理、个人信贷逾期总金额、申贷前一个月征信次数等连续型数据也存在着差异较大的问题,因此需要对特征提取后的数据进行预处理。数据预处图 3.2 所示。
【参考文献】:
期刊论文
[1]基于ADS2的嵌入式软件测试仿真程序设计方法研究[J]. 张海军. 科技风. 2019(12)
[2]Logistic回归及ROC曲线综合评价动脉粥样硬化危险因素对雄激素性秃发的影响[J]. 卢婉娇,王鲁梅,裴小平,李俊杰. 现代医院. 2019(04)
[3]Web应用软件测试方法研究[J]. 付佳,李宝安. 计算机产品与流通. 2019(04)
[4]A Classifier Using Online Bagging Ensemble Method for Big Data Stream Learning[J]. Yanxia Lv,Sancheng Peng,Ying Yuan,Cong Wang,Pengfei Yin,Jiemin Liu,Cuirong Wang. Tsinghua Science and Technology. 2019(04)
[5]一种基于Rosetta的神经网络数据预处理方法[J]. 刘宇程,赵熙. 电子世界. 2019(07)
[6]基于聚类分析运营商流量精准营销研究[J]. 朱琦,朱正键,刘肖. 电信工程技术与标准化. 2019(03)
[7]Development of a particle swarm optimization based support vector regression model for titanium dioxide band gap characterization[J]. Taoreed O.Owolabi. Journal of Semiconductors. 2019(02)
[8]基于聚类分析和判别分析法建立住院患者护理难度等级划分[J]. 朱静,杨颖,陶岚,陈丽方,王迪,钟琴,宋玉磊,柏亚妹. 中国医院. 2019(02)
[9]基于XGBoost算法的用户评分预测模型及应用[J]. 杨贵军,徐雪,赵富强. 数据分析与知识发现. 2019(01)
[10]大型复杂系统软件测试管理[J]. 文洋,杜晨,王定军. 电子技术与软件工程. 2018(19)
博士论文
[1]针对含有概念漂移问题的增量学习算法研究[D]. 孙宇.中国科学技术大学 2017
[2]基于支持向量机的岩土非线性变形行为预测研究[D]. 董辉.中南大学 2007
硕士论文
[1]基于LightGBM与XGBoost算法的P2P网络借贷违约预测模型的比较研究[D]. 沙靖岚.东北财经大学 2017
[2]四种数据挖掘算法的信用卡违约识别对比研究[D]. 朱健.大连理工大学 2017
[3]远程遥控智能家居系统设计与实现[D]. 王少佐.河北工业大学 2015
[4]基于集成学习的人脸特征抽取及识别研究[D]. 周中侠.扬州大学 2014
[5]我国商业银行信用卡市场竞争力研究[D]. 尚广亮.山东大学 2012
[6]集成分类器及其在个人信用评估的应用[D]. 王飞.中南大学 2012
[7]后危机时代我国银行系统性风险研究[D]. 王蕾.吉林财经大学 2012
[8]基于KMV模型的银行信用风险预测研究[D]. 兰艳红.天津师范大学 2010
本文编号:3570459
【文章来源】:郑州大学河南省 211工程院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
Bagging基本原理
3 个人信贷决策模型的设计与构建估指标的选择必须综合考虑各方面的因素,从不同的角度评估借贷客户违约的可能性。本文在分析了国外具有代表性的商业银行的评估指标后,结合国内商业银行的评估指标,将个人信用评估指标分为个人指标、社会指标、经济指标三大类。其中社会指标主要指借贷客户以往的个人信用记录,这部分的指标主要反映借贷人偿还贷款的主观意愿;经济指标主要包括个人年收入、当前的负债状况等,这部分指标主要反映客户当前的还款能力;个人指标包括工龄、受教育程度、年龄等,这部分指标是个人信用风险评估的基本指标[34]。在考虑了个人信用评估指标的科学性和可获取性后,下图给出了本文构建个人信贷决策模型时所选择的个人信用评估指标。
主观意愿这三个部分对应于经过特征提取后,个人信贷决策模型输入征信息,共 21 维信用评价指标。在参考了国外先进银行对个人信用评并结合我国商业银行业务模式后,将其中部分个人信用评估指标进行工作单位细分为国家党政机关、事业单位、国有企业、私营企业、个体户受教育程度细分为硕士研究生及以上、大学本科、大专、高中(中专)、;婚姻状况细分为已婚、未婚、离异、丧偶;申贷时陪同人员细分为无家人、同事、其他。经过特征提取后的个人信用评估指标构成了个人信型的输入,下面将对这部分特征进行处理。 数据预处理个人信用评估指标中,存在着职业、是否有车、受教育程度、是否有房况、申贷时陪同人员、性别等离散型数据,对这些数据需要进行量化处理、个人信贷逾期总金额、申贷前一个月征信次数等连续型数据也存在着差异较大的问题,因此需要对特征提取后的数据进行预处理。数据预处图 3.2 所示。
【参考文献】:
期刊论文
[1]基于ADS2的嵌入式软件测试仿真程序设计方法研究[J]. 张海军. 科技风. 2019(12)
[2]Logistic回归及ROC曲线综合评价动脉粥样硬化危险因素对雄激素性秃发的影响[J]. 卢婉娇,王鲁梅,裴小平,李俊杰. 现代医院. 2019(04)
[3]Web应用软件测试方法研究[J]. 付佳,李宝安. 计算机产品与流通. 2019(04)
[4]A Classifier Using Online Bagging Ensemble Method for Big Data Stream Learning[J]. Yanxia Lv,Sancheng Peng,Ying Yuan,Cong Wang,Pengfei Yin,Jiemin Liu,Cuirong Wang. Tsinghua Science and Technology. 2019(04)
[5]一种基于Rosetta的神经网络数据预处理方法[J]. 刘宇程,赵熙. 电子世界. 2019(07)
[6]基于聚类分析运营商流量精准营销研究[J]. 朱琦,朱正键,刘肖. 电信工程技术与标准化. 2019(03)
[7]Development of a particle swarm optimization based support vector regression model for titanium dioxide band gap characterization[J]. Taoreed O.Owolabi. Journal of Semiconductors. 2019(02)
[8]基于聚类分析和判别分析法建立住院患者护理难度等级划分[J]. 朱静,杨颖,陶岚,陈丽方,王迪,钟琴,宋玉磊,柏亚妹. 中国医院. 2019(02)
[9]基于XGBoost算法的用户评分预测模型及应用[J]. 杨贵军,徐雪,赵富强. 数据分析与知识发现. 2019(01)
[10]大型复杂系统软件测试管理[J]. 文洋,杜晨,王定军. 电子技术与软件工程. 2018(19)
博士论文
[1]针对含有概念漂移问题的增量学习算法研究[D]. 孙宇.中国科学技术大学 2017
[2]基于支持向量机的岩土非线性变形行为预测研究[D]. 董辉.中南大学 2007
硕士论文
[1]基于LightGBM与XGBoost算法的P2P网络借贷违约预测模型的比较研究[D]. 沙靖岚.东北财经大学 2017
[2]四种数据挖掘算法的信用卡违约识别对比研究[D]. 朱健.大连理工大学 2017
[3]远程遥控智能家居系统设计与实现[D]. 王少佐.河北工业大学 2015
[4]基于集成学习的人脸特征抽取及识别研究[D]. 周中侠.扬州大学 2014
[5]我国商业银行信用卡市场竞争力研究[D]. 尚广亮.山东大学 2012
[6]集成分类器及其在个人信用评估的应用[D]. 王飞.中南大学 2012
[7]后危机时代我国银行系统性风险研究[D]. 王蕾.吉林财经大学 2012
[8]基于KMV模型的银行信用风险预测研究[D]. 兰艳红.天津师范大学 2010
本文编号:3570459
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3570459.html