当前位置:主页 > 经济论文 > 银行论文 >

数据挖掘组合模型在个人信用风险评估中的应用

发布时间:2019-04-02 17:38
【摘要】:随着个人消费信贷的快速发展,国内个人信用卡的使用正表现出与日俱增的趋势,越来越多的人们认识到信用贷款的便捷与好处,更有走在前端的金融人士将信用贷款作为一种投资手段加以利用,那么为了快速而有效地对他们进行个人信用风险评估和预测,越来越多的相关业务部门开始需要利用数学挖掘等科学高效的技术来实现用户的评估和评价。本文以Lending Club公司个人消费信贷数据为基础,将数据挖掘技术应用于P2P信贷领域。在进行了相关的理论分析后,本文对数据进行了大量的基础处理,如数据转换、缺失值处理、数据整合及数据标准化等,从根本上保证数据的正确性、一致性、完整性和可靠性。文章随后对借款人进行了用户画像,从描述性统计上首先掌握了借款人的相关信息。之后根据标准化后的整齐数据框,建立了单一预测模型,包括logistic回归模型和人工神经网络模型,在模型建立过程中对它们进行优化,达到了最好的单一模型预测结果。然后通过随机森林的训练来挑选出借款人的有效预测变量,剔除冗余指标对预测结果的干扰,加上Logistic回归的输出结果(即概率值)作为新增的重要变量,共同作为人工神经网络模型的输入端变量建立了组合模型。经验证,组合模型比单一模型的准确率更高,稳定性更强,可解释性更优良。最后,本文对分析过程中存在的一些潜在问题进行了剖析,并对后续的工作进行了展望。本文的最终目的在于利用国外已经相对成熟的P2P网贷经营模式下产生的借款人画像来建立有效的风险评估模型,推动建设国内的个人信用风险评估体系,以期为个人消费信贷这类商业实践提供一定的技术支持。
[Abstract]:With the rapid development of personal consumer credit, the use of personal credit cards in China is showing a growing trend, and more people realize the convenience and benefits of credit loans. In order to quickly and effectively assess and predict their personal credit risk, some financial people who go to the front end use credit loans as an investment tool, so that they can be quickly and effectively assessed and predicted their personal credit risks. More and more related business departments need to use scientific and efficient technology such as mathematical mining to realize the evaluation and evaluation of users. Based on the personal consumption credit data of Lending Club Company, this paper applies data mining technology to P2P credit field. After the relevant theoretical analysis, this paper has carried on a lot of basic processing to the data, such as data conversion, missing value processing, data integration and data standardization, and so on, which ensures the correctness and consistency of the data fundamentally. Integrity and reliability. Then, the paper makes a user portrait of the borrower, and first grasps the relevant information of the borrower from descriptive statistics. Then a single prediction model, including logistic regression model and artificial neural network model, is established according to the standardized neat data frame. The model is optimized in the process of establishing the model, and the best single model prediction result is achieved. Then through the random forest training to select the borrower's effective forecast variables, eliminate the redundancy index interference to the prediction results, plus the Logistic regression output results (that is, probability value) as the new important variable. As the input variables of artificial neural network (Ann) model, a combined model is established. It is proved that the combination model is more accurate, more stable and more explanatory than a single model. Finally, some potential problems in the process of analysis are analyzed, and the future work is prospected. The ultimate purpose of this paper is to build an effective risk assessment model by using the portrait of the borrower under the relatively mature P2P network loan management mode in foreign countries, and to promote the construction of the domestic personal credit risk assessment system. In order to provide some technical support for personal consumption credit business practice.
【学位授予单位】:首都经济贸易大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:F832.4

【参考文献】

相关期刊论文 前10条

1 柳向东;李凤;;大数据背景下网络借贷的信用风险评估——以人人贷为例[J];统计与信息论坛;2016年05期

2 黄巍;张靓;唐友;;基于SVM算法的个人信用评估方法的完善[J];黑龙江八一农垦大学学报;2016年02期

3 韩民;郑庆寰;;美国小企业P2P网络借贷分析与监管改革——基于Lending Club的数据[J];现代财经(天津财经大学学报);2016年04期

4 訾达;;中美P2P平台运营模式比较——以有利网和Lending Club为例[J];金融经济;2015年18期

5 史小康;何晓群;;有偏logistic回归模型及其在个人信用评级中的应用研究[J];数理统计与管理;2015年06期

6 温小霓;武小娟;;P2P网络借贷成功率影响因素分析——以拍拍贷为例[J];金融论坛;2014年03期

7 姜明辉;谢行恒;王树林;温潇;;个人信用评估的Logistic-RBF组合模型[J];哈尔滨工业大学学报;2007年07期

8 肖文兵;费奇;;基于支持向量机的个人信用评估模型及最优参数选择研究[J];系统工程理论与实践;2006年10期

9 钟波,肖智 ,刘朝林,陈玲;基于LS-SVM的信用评价方法[J];统计研究;2005年11期

10 石庆焱;一个基于神经网络——Logistic回归的混合两阶段个人信用评分模型研究[J];统计研究;2005年05期

相关会议论文 前1条

1 刘晶;谭峰;柴容倩;;个人信用风险评估方法的研究——基于lending club数据[A];2015年(第四届)全国大学生统计建模大赛论文[C];2015年

相关博士学位论文 前5条

1 帅理;个人信用风险评估理论与方法的拓展研究[D];电子科技大学;2015年

2 向晖;个人信用评分组合模型研究与应用[D];湖南大学;2011年

3 陈为民;基于支持向量机的信用卡信用风险管理模型与技术研究[D];湖南大学;2009年

4 赵静娴;基于决策树的信用风险评估方法研究[D];天津大学;2009年

5 沈翠华;基于支持向量机的消费信贷中个人信用评估方法研究[D];中国农业大学;2005年

相关硕士学位论文 前10条

1 林丽涛;Lending Club P2P平台风险管理控制体系研究[D];北京林业大学;2016年

2 王梦佳;基于Logistic回归模型的P2P网贷平台借款人信用风险评估[D];北京外国语大学;2015年

3 张佳维;基于模糊神经网络的个人信用风险评估[D];内蒙古大学;2014年

4 周轩;基于数据挖掘技术的商业银行个人信用评分模型研究[D];湖南大学;2014年

5 白金瑞;基于Logistic回归的神经网络模型在个人信用评估中的应用[D];内蒙古大学;2012年

6 冯琼;基于组合预测模型的银行个人信用风险评估体系应用研究[D];中南民族大学;2011年

7 王远庆;基于数据挖掘技术的个人信用评估模型研究[D];西南财经大学;2009年

8 王琪;基于数据挖掘的商业银行个人信用风险评估体系研究[D];北京交通大学;2009年

9 李景亮;数据挖掘技术在个人信贷分析中的应用[D];华东师范大学;2008年

10 杨旭;神经网络在个人住房贷款信用评估中的研究[D];对外经济贸易大学;2007年



本文编号:2452759

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/2452759.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ff70d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com