改进的SVM-KNN信用风险评估模型研究
发布时间:2020-08-26 21:50
【摘要】:随着社会经济的快速发展,越来越多的人选择以投资的方式获取利益。在很多情况下,投资资金的匮乏使信贷人选择银行贷款,贷款人的信用评估也成为商业银行信贷的重要组成部分。寻找合理高效的信用评估模型,对推动我国信用制度的建设和社会主义市场经济的发展有着重要的现实意义。本文基于信用风险评估数据讨论了支持向量机(SVM)和SVM-KNN组合模型的分类效果,并对组合模型采用网格搜索算法和粒子群(PSO)算法进行参数优化,参数优化后的组合模型在实证分析中有很好的预测分类效果。本文主要研究内容包括:(1)介绍了数据的来源,并对数据进行了描述性分析,由于数据属性的量纲不同,为提高模型的准确度对数值型数据进行归一化处理,字符型数据进行赋值后归一化处理。(2)应用SVM算法训练分类器并进行数据分类,在不同的训练样本量和不同的核函数下进行实证分析对比,分析不同训练样本量和不同核函数对模型分类准确率的影响。(3)对数据进行最近邻(KNN)分类,KNN分类器在测试集上得到良好的分类效果。由于SVM分类器对分类超平面比较近的样本点容易分类错误,所以将距离分类超平面比较近的点进行KNN分类,即应用SVM-KNN的组合模型对测试样本分类,进行实证分析对比,组合模型的分类准确率较之前有所提高。(4)由于SVM-KNN分类算法中正则化参数和核函数参数对数据的分类准确率有很大影响,为此,本文提出改进的SVM-KNN模型,该模型应用网格搜索算法和粒子群算法对组合模型参数进行优化,分别得到两组最优参数,通过实证分析对比,改进后的SVM-KNN模型能够有效提高数据集的分类准确率。
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP18;F831.2
【图文】:
图2-1现有支票账户状态与信用状况关系柱状图逡逑
票账户状态为All邋(小于0)时,优质客户和劣质客户的占比基本为1:1,几乎无逡逑差别。但当支票账户中的钱变多时,优质客户和劣质客户比例明显不同,比如当逡逑支票账户状态为A13邋(大于200)时优质客户和劣质客户占比大于3:1,即支票账逡逑户中的钱越多时,被判别为劣质客户的概率越小,当没有支票账户时,优质客户逡逑和劣质客户比例将近9:1。所以现有支票账户对信用状况有着显著的影响,可作为逡逑信用评估体系的指标。逡逑表2-4信用记录与信用状况关系表逡逑信用记录属性逡逑A30逦A31逦A32逦A33逦A34逡逑值逡逑优质客户占比逦0.375逦0.429逦0.681逦0.682逦0.829逡逑劣质客户占比逦0.625逦0.571逦0.319逦0.318逦0.171逡逑总计逦11111逡逑
逦第二章数据说明及预处理逦逡逑表2-5储蓄账户(债券)与信用状况关系表逡逑储蓄=N债券) ̄^逦^逦^逡逑属性值逡逑优质客户占比逦0.640逦0.670逦0.825逦0.875逦0.825逡逑劣质客户占比逦0.360逦0.330逦0.175逦0.125逦0.175逡逑总计逦11111逡逑
本文编号:2805739
【学位授予单位】:云南大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP18;F831.2
【图文】:
图2-1现有支票账户状态与信用状况关系柱状图逡逑
票账户状态为All邋(小于0)时,优质客户和劣质客户的占比基本为1:1,几乎无逡逑差别。但当支票账户中的钱变多时,优质客户和劣质客户比例明显不同,比如当逡逑支票账户状态为A13邋(大于200)时优质客户和劣质客户占比大于3:1,即支票账逡逑户中的钱越多时,被判别为劣质客户的概率越小,当没有支票账户时,优质客户逡逑和劣质客户比例将近9:1。所以现有支票账户对信用状况有着显著的影响,可作为逡逑信用评估体系的指标。逡逑表2-4信用记录与信用状况关系表逡逑信用记录属性逡逑A30逦A31逦A32逦A33逦A34逡逑值逡逑优质客户占比逦0.375逦0.429逦0.681逦0.682逦0.829逡逑劣质客户占比逦0.625逦0.571逦0.319逦0.318逦0.171逡逑总计逦11111逡逑
逦第二章数据说明及预处理逦逡逑表2-5储蓄账户(债券)与信用状况关系表逡逑储蓄=N债券) ̄^逦^逦^逡逑属性值逡逑优质客户占比逦0.640逦0.670逦0.825逦0.875逦0.825逡逑劣质客户占比逦0.360逦0.330逦0.175逦0.125逦0.175逡逑总计逦11111逡逑
【参考文献】
相关期刊论文 前7条
1 白俊杰;龚毅光;王宁生;唐敦兵;;面向订单制造的可重构制造系统中虚拟制造单元构建技术[J];计算机集成制造系统;2009年02期
2 肖文兵;费奇;万虎;;基于支持向量机的信用评估模型及风险评价[J];华中科技大学学报(自然科学版);2007年05期
3 李淑霞;单鸿波;;基于敏捷制造单元的车间动态重构[J];计算机集成制造系统;2007年03期
4 王朝勇;;基于LS-SVM的个人信用评估[J];吉林工程技术师范学院学报;2005年12期
5 徐长荣;巴塞尔新资本协议与我国商业银行信用风险管理对策研究[J];商业研究;2005年03期
6 杨维,李歧强;粒子群优化算法综述[J];中国工程科学;2004年05期
7 李蓉 ,叶世伟 ,史忠植;SVM-KNN分类器——一种提高SVM分类精度的新方法[J];电子学报;2002年05期
相关硕士学位论文 前2条
1 王健峰;基于改进网格搜索法SVM参数优化的说话人识别研究[D];哈尔滨工程大学;2012年
2 丁刚;基于支持向量机的移动机器人环境感知和物体识别研究[D];中国科学技术大学;2009年
本文编号:2805739
本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/2805739.html