银行信用卡违约预测问题中的特征选择方法研究
发布时间:2022-10-04 13:12
因信用卡给人们带来便利,越来越多的人使用信用卡。各大银行为了抢占市场,也在最大化地发展客户,导致信用卡用户的质量参差不齐,违约还款的情况也越来越严重,银行利益严重受损,故控制违约情况的发生迫在眉睫。信用卡违约预测,即:提前发现潜在的违约还款用户,可以为违约控制提供重要依据,以便银行及时采取有效措施。随着信息技术的快速发展和银行数据体系的逐渐健全,信用卡消费数据日渐丰富,规模和复杂性也日趋增长。深入挖掘并分析信用卡消费数据,探索消费行为中隐藏的模式不仅可以帮助银行进一步地了解信用卡用户的消费行为,而且还有助于选取对违约预测有用的信息,从而帮助违约预测。因此,针对信用卡违约预测问题,本文对信用卡消费数据进行了深入挖掘和分析,并在此基础上对特征选择展开了研究,提出了两种特征选择方法。本文的主要工作如下:(1)以网络为视角对某银行的信用卡消费数据集进行挖掘和分析,发现了特征之间存在一种有趣的模式,即:特征呈现聚簇现象。该模式不仅揭示了特征之间的复杂关系,还有助于发现信息量大的特征。(2)基于发现的特征模式,提出了基于社区的特征选择方法,然后将其特征选择结果用于训练信用卡违约预测模型。在真实数据...
【文章页数】:82 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题的研究背景及意义
1.2 国内外研究现状
1.3 本文内容及结构
第2章 信用卡违约预测理论方法概述
2.1 信用卡违约预测模型
2.1.1 朴素贝叶斯模型
2.1.2 K近邻分类模型
2.1.3 逻辑斯蒂回归模型
2.1.4 支持向量机分类模型
2.1.5 梯度提升决策树模型
2.1.6 随机森林模型
2.2 信用卡特征选择方法
2.2.1 卡方检验
2.2.2 皮尔森相关系数
2.2.3 互信息
2.2.4 Lasso
2.3 社区发现方法
2.3.1 复杂网络
2.3.2 社区结构
2.3.3 社区发现基本理论
2.3.4 标签传播算法
2.4 本章小节
第3章 信用卡消费数据的隐含模式
3.1 数据集
3.2 数据预处理
3.3 相关性
3.4 隐含模式
3.5 本章小结
第4章 基于社区的特征选择及信用违约预测
4.1 基于社区的特征选择方法
4.2 根据不同阈值构建社区及特征选择
4.2.1 基于阈值0.6 构建社区及特征选择
4.2.2 基于阈值0.85 构建社区及特征选择
4.3 预测模型训练和实验结果
4.3.1 预测模型训练
4.3.2 评估标准
4.3.3 基于阈值0.6 的实验结果及分析
4.3.4 基于阈值0.85 的实验结果及分析
4.4 本章小结
第5章 重新加权的特征选择及信用违约预测
5.1 基于社区并重新加权的特征选择方法
5.1.1 重新加权的方法
5.1.2 基于重新加权的特征选择方法
5.2 根据不同阈值划分社区及特征选择
5.2.1 基于阈值0.6 构建社区及特征选择
5.2.2 基于阈值0.85 构建社区及特征选择
5.3 预测模型训练和实验结果
5.3.1 基于0.6 阈值的实验结果及分析
5.3.2 基于0.85 阈值的实验结果及分析
5.4 本章小结
结论
致谢
参考文献
攻读学位期间取得学术成果
附录
附录 A 基于社区的特征选择算法
【参考文献】:
期刊论文
[1]基于随机森林的语音情感特征选择与分类[J]. 邢尹,刘立龙. 计算机与数字工程. 2019(03)
[2]基于特征选择与集成学习的钓鱼网站检测方法[J]. 周传华,柳智才,丁敬安,周家亿. 计算机应用研究. 2019(04)
[3]K最近邻算法理论与应用综述[J]. 毋雪雁,王水花,张煜东. 计算机工程与应用. 2017(21)
[4]基于局部判别约束的半监督特征选择方法[J]. 严菲,王晓栋. 模式识别与人工智能. 2017(01)
[5]基于K-均值聚类的多值有序Logistic回归模型在信用卡信用评级中的应用研究[J]. 王纯杰,李群,董小刚,林珊屹. 吉林师范大学学报(自然科学版). 2016(03)
[6]基于Lasso-logistic模型的个人信用风险预警方法[J]. 方匡南,章贵军,张惠颖. 数量经济技术经济研究. 2014(02)
[7]基于数据挖掘方法对商业银行信用卡违约预测模型的研究[J]. 涂伟华,王索漫. 中国证券期货. 2011(09)
[8]信贷信息不对称下的信用卡信用风险研究[J]. 方匡南,吴见彬,朱建平,谢邦昌. 经济研究. 2010(S1)
[9]基于Logistic回归分析的违约概率预测研究[J]. 于立勇,詹捷辉. 财经研究. 2004(09)
博士论文
[1]商业银行信用卡业务信用风险管理研究[D]. 赵刚.华东师范大学 2007
硕士论文
[1]我国商业银行信用卡违约风险影响因素研究[D]. 强浩桐.兰州大学 2017
[2]信用卡分期业务违约的影响因素及研究[D]. 张晓蕾.暨南大学 2014
本文编号:3685093
【文章页数】:82 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题的研究背景及意义
1.2 国内外研究现状
1.3 本文内容及结构
第2章 信用卡违约预测理论方法概述
2.1 信用卡违约预测模型
2.1.1 朴素贝叶斯模型
2.1.2 K近邻分类模型
2.1.3 逻辑斯蒂回归模型
2.1.4 支持向量机分类模型
2.1.5 梯度提升决策树模型
2.1.6 随机森林模型
2.2 信用卡特征选择方法
2.2.1 卡方检验
2.2.2 皮尔森相关系数
2.2.3 互信息
2.2.4 Lasso
2.3 社区发现方法
2.3.1 复杂网络
2.3.2 社区结构
2.3.3 社区发现基本理论
2.3.4 标签传播算法
2.4 本章小节
第3章 信用卡消费数据的隐含模式
3.1 数据集
3.2 数据预处理
3.3 相关性
3.4 隐含模式
3.5 本章小结
第4章 基于社区的特征选择及信用违约预测
4.1 基于社区的特征选择方法
4.2 根据不同阈值构建社区及特征选择
4.2.1 基于阈值0.6 构建社区及特征选择
4.2.2 基于阈值0.85 构建社区及特征选择
4.3 预测模型训练和实验结果
4.3.1 预测模型训练
4.3.2 评估标准
4.3.3 基于阈值0.6 的实验结果及分析
4.3.4 基于阈值0.85 的实验结果及分析
4.4 本章小结
第5章 重新加权的特征选择及信用违约预测
5.1 基于社区并重新加权的特征选择方法
5.1.1 重新加权的方法
5.1.2 基于重新加权的特征选择方法
5.2 根据不同阈值划分社区及特征选择
5.2.1 基于阈值0.6 构建社区及特征选择
5.2.2 基于阈值0.85 构建社区及特征选择
5.3 预测模型训练和实验结果
5.3.1 基于0.6 阈值的实验结果及分析
5.3.2 基于0.85 阈值的实验结果及分析
5.4 本章小结
结论
致谢
参考文献
攻读学位期间取得学术成果
附录
附录 A 基于社区的特征选择算法
【参考文献】:
期刊论文
[1]基于随机森林的语音情感特征选择与分类[J]. 邢尹,刘立龙. 计算机与数字工程. 2019(03)
[2]基于特征选择与集成学习的钓鱼网站检测方法[J]. 周传华,柳智才,丁敬安,周家亿. 计算机应用研究. 2019(04)
[3]K最近邻算法理论与应用综述[J]. 毋雪雁,王水花,张煜东. 计算机工程与应用. 2017(21)
[4]基于局部判别约束的半监督特征选择方法[J]. 严菲,王晓栋. 模式识别与人工智能. 2017(01)
[5]基于K-均值聚类的多值有序Logistic回归模型在信用卡信用评级中的应用研究[J]. 王纯杰,李群,董小刚,林珊屹. 吉林师范大学学报(自然科学版). 2016(03)
[6]基于Lasso-logistic模型的个人信用风险预警方法[J]. 方匡南,章贵军,张惠颖. 数量经济技术经济研究. 2014(02)
[7]基于数据挖掘方法对商业银行信用卡违约预测模型的研究[J]. 涂伟华,王索漫. 中国证券期货. 2011(09)
[8]信贷信息不对称下的信用卡信用风险研究[J]. 方匡南,吴见彬,朱建平,谢邦昌. 经济研究. 2010(S1)
[9]基于Logistic回归分析的违约概率预测研究[J]. 于立勇,詹捷辉. 财经研究. 2004(09)
博士论文
[1]商业银行信用卡业务信用风险管理研究[D]. 赵刚.华东师范大学 2007
硕士论文
[1]我国商业银行信用卡违约风险影响因素研究[D]. 强浩桐.兰州大学 2017
[2]信用卡分期业务违约的影响因素及研究[D]. 张晓蕾.暨南大学 2014
本文编号:3685093
本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/3685093.html