基于P2P用户数据的借款逾期风险预测研究
发布时间:2020-12-27 02:34
P2P(Peer to Peer),即个人对个人的网络借贷,如今P2P平台在我国发展的如火如荼,但借贷人违约率过高的问题也日益严重,给平台和债权人造成很大损失。这种情况下,如何建立完善的风险预测系统是P2P平台平稳发展的决定性因素。但由于国内P2P行业起步较晚,较多公司在该方面比较薄弱。因此设计一个预测能力好,泛化能力强的模型来构建风险预测系统,对借款者进行信用评价,然后进行借贷逾期预测,降低违约率,是P2P发展急需解决的问题。目前现有的平台,如拍拍贷,陆金服都在增强自己的风险预测模型。为解决以上问题,本文构建了针对P2P借贷人的逾期风险预测模型,本文的主要工作包括:(1)提出了基于融合的风险预测模型的构建方法并阐述了理论基础。(2)在P2P借贷平台用户数据集的基础上,通过数据预处理与对SMOTE算法改进来进行数据优化与类别不平衡问题的解决,将处理好的数据进行特征提取、特征构建与特征选取处理,构建最优特征子集,为后续开展风险预测模型研究奠定基础。(3)研究和比较了常用的风险预测模型,并根据P2P特征子集的特点进行模型的改进与调参,实验结果证明由XGBoost、随机森林与支持向量机构成风...
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
技术路线图
北京工业大学工程硕士专业学位论文辑回归的原理是将线性回归的结果值映射到 sigmoid 函数中,将 0来表示预测结果的概率[37]。假如 a 是一个二分类结果变量,a=0 表常还款,a=1 表示用户逾期缴款,x={x1,x2,x3,…,xn}为 n 维特征,θ2,…,θn}是每个特征对应的参数,可得线性回归公式(2-1):Tn nz x x x = x 后可得逻辑回归公式(2-2):1 1( )1+ 1Tzxh xe e 中 sigmoid 函数为公式(2-3):1y =1xe igmoid 函数及函数导数的图像如图 2-1 所示:
第 2 章 基本理论与相关技术综述逻辑回归的鲁棒性很好,受到数据中小噪声的影响小,并且不会重共线性的特别影响。回归缺点:模型学习时容易欠拟合,分类精度相对较低。数据提取的特征有缺失或者特征空间很大时表现效果并不好。持向量机(支持向量机),属于有监督学习算法的一种,即可用于分类,也质在于在特征空间寻求一个间隔最大的超平面[38]。算法的核心:当待分类数据集中的数据是线性可分的,只要将线 L 放在离两远的位置,如图 2-2 所示,此时 x1=x2。寻找这个最大距离的过。
【参考文献】:
期刊论文
[1]基于非均衡模糊近似支持向量机的P2P网贷借款人信用风险评估及应用[J]. 张卫国,卢媛媛,刘勇军. 系统工程理论与实践. 2018(10)
[2]P2P网贷借款人违约风险评估——基于决策树的研究[J]. 沈玉溪,徐浩. 经营与管理. 2018(09)
[3]基于XGBoost算法的病例分型系统设计[J]. 俞高. 中国数字医学. 2018(03)
[4]基于BP神经网络的P2P网贷借款人信用风险评估研究[J]. 李昕,戴一成. 武汉金融. 2018(02)
[5]P2P借贷中借款人的违约风险评估——基于“人人贷”数据的实证分析[J]. 阮素梅,何浩然,李敬明. 经济问题. 2017(12)
[6]Logistic回归模型在P2P平台风险评估中的应用[J]. 汤璇. 湖北经济学院学报(人文社会科学版). 2017(04)
[7]P2P网贷平台借款人信用风险评估研究[J]. 霍江林,刘素荣. 金融发展研究. 2016(12)
[8]基于Logistic回归模型的P2P网贷平台新进借款人信用风险研究[J]. 董梁,胡明雅. 江苏科技大学学报(社会科学版). 2016(03)
[9]基于BP神经网络的P2P网贷借款者的信用风险评估[J]. 李淑锦,吕靖强. 生产力研究. 2016(04)
[10]P2P网络贷款信用的风险评估[J]. 傅彦铭,臧敦刚,戚名钰. 统计与决策. 2014(21)
硕士论文
[1]随机森林在P2P网贷借款信用风险评估中的应用[D]. 徐婷婷.山东大学 2017
[2]基于BP神经网络模型的中国P2P借款人信用风险评估研究[D]. 黄震.北京交通大学 2015
[3]基于粗糙集和神经网络的中小企业信用评估体系及模型的研究[D]. 李晓欢.内蒙古大学 2010
本文编号:2940931
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
技术路线图
北京工业大学工程硕士专业学位论文辑回归的原理是将线性回归的结果值映射到 sigmoid 函数中,将 0来表示预测结果的概率[37]。假如 a 是一个二分类结果变量,a=0 表常还款,a=1 表示用户逾期缴款,x={x1,x2,x3,…,xn}为 n 维特征,θ2,…,θn}是每个特征对应的参数,可得线性回归公式(2-1):Tn nz x x x = x 后可得逻辑回归公式(2-2):1 1( )1+ 1Tzxh xe e 中 sigmoid 函数为公式(2-3):1y =1xe igmoid 函数及函数导数的图像如图 2-1 所示:
第 2 章 基本理论与相关技术综述逻辑回归的鲁棒性很好,受到数据中小噪声的影响小,并且不会重共线性的特别影响。回归缺点:模型学习时容易欠拟合,分类精度相对较低。数据提取的特征有缺失或者特征空间很大时表现效果并不好。持向量机(支持向量机),属于有监督学习算法的一种,即可用于分类,也质在于在特征空间寻求一个间隔最大的超平面[38]。算法的核心:当待分类数据集中的数据是线性可分的,只要将线 L 放在离两远的位置,如图 2-2 所示,此时 x1=x2。寻找这个最大距离的过。
【参考文献】:
期刊论文
[1]基于非均衡模糊近似支持向量机的P2P网贷借款人信用风险评估及应用[J]. 张卫国,卢媛媛,刘勇军. 系统工程理论与实践. 2018(10)
[2]P2P网贷借款人违约风险评估——基于决策树的研究[J]. 沈玉溪,徐浩. 经营与管理. 2018(09)
[3]基于XGBoost算法的病例分型系统设计[J]. 俞高. 中国数字医学. 2018(03)
[4]基于BP神经网络的P2P网贷借款人信用风险评估研究[J]. 李昕,戴一成. 武汉金融. 2018(02)
[5]P2P借贷中借款人的违约风险评估——基于“人人贷”数据的实证分析[J]. 阮素梅,何浩然,李敬明. 经济问题. 2017(12)
[6]Logistic回归模型在P2P平台风险评估中的应用[J]. 汤璇. 湖北经济学院学报(人文社会科学版). 2017(04)
[7]P2P网贷平台借款人信用风险评估研究[J]. 霍江林,刘素荣. 金融发展研究. 2016(12)
[8]基于Logistic回归模型的P2P网贷平台新进借款人信用风险研究[J]. 董梁,胡明雅. 江苏科技大学学报(社会科学版). 2016(03)
[9]基于BP神经网络的P2P网贷借款者的信用风险评估[J]. 李淑锦,吕靖强. 生产力研究. 2016(04)
[10]P2P网络贷款信用的风险评估[J]. 傅彦铭,臧敦刚,戚名钰. 统计与决策. 2014(21)
硕士论文
[1]随机森林在P2P网贷借款信用风险评估中的应用[D]. 徐婷婷.山东大学 2017
[2]基于BP神经网络模型的中国P2P借款人信用风险评估研究[D]. 黄震.北京交通大学 2015
[3]基于粗糙集和神经网络的中小企业信用评估体系及模型的研究[D]. 李晓欢.内蒙古大学 2010
本文编号:2940931
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2940931.html