基于加权惩罚逻辑回归的贷款违约预测
发布时间:2021-08-18 23:06
互联网金融的飞速发展,银行对贷款风险的管理重视程度逐渐升高,因此降低客户的不良贷款率,并且判断出存在较大贷款还款违约风险的贷款客户显得格外重要,基于惩罚逻辑回归算法的贷款违约预测模型便应运而生。该模型根据用户基本属性数据以及下载APP种类的数据,实现特征提取并进行数据加权处理,进而利用带惩罚的逻辑回归来进行预测模型构建,提升对于贷款客户是否会违约的判断准确性,进而可以提升银行对于贷款客户的风险评估及管理控制,采用此方法极大地降低了银行的客户贷款隐患。
【文章来源】:信息技术与信息化. 2020,(07)
【文章页数】:4 页
【部分图文】:
贷款数据特征提取及预测算法流程图
用户数据均为从互联网下载开放数据,但数据会存在个别及小部分缺失,因此首先需对数据进行预处理工作,首先使pandas、numpy进行用户基本属性数据进行读取及处理,丢掉数据中整体缺失的特征数据,如图4为部分用户基础特征数据,其中app1254、overdueDaysGe5PrincipleRatio等确实部分需要预处理后去除。2.2 利用TF-IDF进行特征提取及加权处理
本文所处理的APP数据如图2所示,利用TFIDF-Vectorizer可以把原始文本转化为tf-idf的特征矩阵,从而为后续的文本相似度计算,主题模型,文本搜索排序等一系列应用奠定基础。除去可以考量某些字词在文本出现的频率,还注重包含这个词汇的所有文本数量,可以减少高频或意义不大的字词出现所带来的影响,深度挖掘更加有意义的特征。针对用户下载APP统计数据,将各用户下载APP名称看作词语,将下载人群多、下载量大这些非典型且不具有较高参考意义的APP(例如微信APP),以及代表性较强的APP(例如贷款APP)进行权重的变化,增大对于预测判断的有意义数据权重,减小非重要数据的权重,使数据变为有价值的可用数据。本文实验也对于加权前及加权后分别进行预测数据的实验,并将预测结果进行对比。1.2 构建基于惩罚逻辑回归预测算法进行贷款预测
本文编号:3350797
【文章来源】:信息技术与信息化. 2020,(07)
【文章页数】:4 页
【部分图文】:
贷款数据特征提取及预测算法流程图
用户数据均为从互联网下载开放数据,但数据会存在个别及小部分缺失,因此首先需对数据进行预处理工作,首先使pandas、numpy进行用户基本属性数据进行读取及处理,丢掉数据中整体缺失的特征数据,如图4为部分用户基础特征数据,其中app1254、overdueDaysGe5PrincipleRatio等确实部分需要预处理后去除。2.2 利用TF-IDF进行特征提取及加权处理
本文所处理的APP数据如图2所示,利用TFIDF-Vectorizer可以把原始文本转化为tf-idf的特征矩阵,从而为后续的文本相似度计算,主题模型,文本搜索排序等一系列应用奠定基础。除去可以考量某些字词在文本出现的频率,还注重包含这个词汇的所有文本数量,可以减少高频或意义不大的字词出现所带来的影响,深度挖掘更加有意义的特征。针对用户下载APP统计数据,将各用户下载APP名称看作词语,将下载人群多、下载量大这些非典型且不具有较高参考意义的APP(例如微信APP),以及代表性较强的APP(例如贷款APP)进行权重的变化,增大对于预测判断的有意义数据权重,减小非重要数据的权重,使数据变为有价值的可用数据。本文实验也对于加权前及加权后分别进行预测数据的实验,并将预测结果进行对比。1.2 构建基于惩罚逻辑回归预测算法进行贷款预测
本文编号:3350797
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/3350797.html