基于多数据集融合的个人信用评估分析
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
图1-1GBDT与LR融合结构
基于多数据集融合的个人信用评估分析17图1-1GBDT与LR融合结构同理,其它树模型如XGBoost和随机森林也可以和LR模型融合,由于XGBoost在其他分类任务的良好表现,本文选用了XGBoost进行特征构造并与GBDT进行对比,判定哪一种树模型与LR模型组合的效果更好。(二....
图2-2业务A数据集缺失值情况及排序通过对业务A数据集进行探索性分析发现部分特征存在异常值的情况,主要表
第二章信用评估数据的统计分析和特征提取22的缺失值估算方法,但最终还是使用固定值0或均值填充的方法效果最好29。为了防止数据变换出现无穷大的情况,本文将所有的缺失值采用固定值0替换。图2-2业务A数据集缺失值情况及排序通过对业务A数据集进行探索性分析发现部分特征存在异常值的情况,....
图2-3业务A数据集存在异常值变量另外,发现业务A数据集中的某些变量存在数据偏斜这一情况,通过对每个变
第二章信用评估数据的统计分析和特征提取22的缺失值估算方法,但最终还是使用固定值0或均值填充的方法效果最好29。为了防止数据变换出现无穷大的情况,本文将所有的缺失值采用固定值0替换。图2-2业务A数据集缺失值情况及排序通过对业务A数据集进行探索性分析发现部分特征存在异常值的情况,....
图2-4部分变量数据偏斜可视化
基于多数据集融合的个人信用评估分析23图2-4部分变量数据偏斜可视化对于存在数据偏斜的变量特征,严重的直接删除,偏斜较轻的采用log(x+1)进行数值转换达到缩小数值之间差距的目的,随机选取了部分偏斜变量处理后的效果见表2-2所示。经计算并对比原始数据及进行log(x+1)数值变....
本文编号:3916076
本文链接:https://www.wllwen.com/sizhenglunwen/3916076.html