期望损失代价敏感优化的借贷预测算法研究
发布时间:2021-11-23 05:21
借贷数据规模大、维度复杂和极度不平衡等特性致使借贷预测的精度一直难以提升。为此,设计量化借贷期望损失值作为代价敏感项来优化集成模型的借贷预测算法,实现消除比例失衡的训练样本对预测模型的影响;提出基于代价敏感集成学习的借贷预测算法——ES-XGB和ES-LGB。其核心是改进了近年来表现优异的集成算法XGBoost和LightGBM,将优化后损失项加入模型的迭代学习过程中,以达到提升整体预测精度和提高违约类检出的目的。使用Lending Club平台提供的数据来做数值实验,证明所提出的算法模型在借贷预测中表现最佳。
【文章来源】:浙江工业大学学报. 2020,48(04)北大核心
【文章页数】:8 页
【部分图文】:
各年份不同状态的借贷数量和比例
筛选出模型ES-LGB中贡献率排名前20的特征值,绘制权重比图,如图2所示。特征所对应的横向直方图越长代表在模型中分类贡献性越强。特征项2和特征项18为本研究根据借贷场景创建的特征,其中特征项2“月收入与月还款额比率”排名第二,说明特征工程创建的特征项可以很好帮助划分借贷人的类别。根据ES-LGB建模还可以学习到属于“银行账户信息”“信用记录”的特征因素对借贷申请人的还款行为有较大影响,而属于“个人信息”维度的特征项没有进入重要特征的前20位,对模型分类能力影响较弱。
【参考文献】:
期刊论文
[1]基于Expectile回归的均值-ES组合投资决策[J]. 许启发,丁晓涵,蒋翠侠. 中国管理科学. 2018(10)
[2]基于LightGBM算法的P2P项目信用评级模型的设计及应用[J]. 马晓君,沙靖岚,牛雪琪. 数量经济技术经济研究. 2018(05)
[3]结合背景差分与光流法的人群状态突变检测[J]. 高鹏辉,赵武峰,沈继忠. 浙江大学学报(工学版). 2018(04)
[4]一种基于最小二乘估计的LTEMR电平信号定位方法[J]. 王卫红,琚波,杨洁,程宏兵. 浙江工业大学学报. 2015(05)
[5]基于AHP和GIS的海塘工程安全评价研究[J]. 刘俊萍. 浙江工业大学学报. 2014(04)
硕士论文
[1]基于数据挖掘的我国P2P网络借贷违约预测模型研究[D]. 刘瑾雯.大连理工大学 2016
本文编号:3513212
【文章来源】:浙江工业大学学报. 2020,48(04)北大核心
【文章页数】:8 页
【部分图文】:
各年份不同状态的借贷数量和比例
筛选出模型ES-LGB中贡献率排名前20的特征值,绘制权重比图,如图2所示。特征所对应的横向直方图越长代表在模型中分类贡献性越强。特征项2和特征项18为本研究根据借贷场景创建的特征,其中特征项2“月收入与月还款额比率”排名第二,说明特征工程创建的特征项可以很好帮助划分借贷人的类别。根据ES-LGB建模还可以学习到属于“银行账户信息”“信用记录”的特征因素对借贷申请人的还款行为有较大影响,而属于“个人信息”维度的特征项没有进入重要特征的前20位,对模型分类能力影响较弱。
【参考文献】:
期刊论文
[1]基于Expectile回归的均值-ES组合投资决策[J]. 许启发,丁晓涵,蒋翠侠. 中国管理科学. 2018(10)
[2]基于LightGBM算法的P2P项目信用评级模型的设计及应用[J]. 马晓君,沙靖岚,牛雪琪. 数量经济技术经济研究. 2018(05)
[3]结合背景差分与光流法的人群状态突变检测[J]. 高鹏辉,赵武峰,沈继忠. 浙江大学学报(工学版). 2018(04)
[4]一种基于最小二乘估计的LTEMR电平信号定位方法[J]. 王卫红,琚波,杨洁,程宏兵. 浙江工业大学学报. 2015(05)
[5]基于AHP和GIS的海塘工程安全评价研究[J]. 刘俊萍. 浙江工业大学学报. 2014(04)
硕士论文
[1]基于数据挖掘的我国P2P网络借贷违约预测模型研究[D]. 刘瑾雯.大连理工大学 2016
本文编号:3513212
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/3513212.html