基于灰色关联度与改进SMOTE的支持向量机建模与应用
本文关键词:基于灰色关联度与改进SMOTE的支持向量机建模与应用,由笔耕文化传播整理发布。
【摘要】:随着信贷行业的迅速发展和数据挖掘技术的不断进步,传统人工完成的信用风险评估工作正逐步被大数据背景下的机器学习所代替。作为一种有效的分类工具,支持向量机通过对历史样本的学习,可在短时间内构建出一个分类模型,用于对新样本所属类别的判定。严格的数学推理和扎实的统计学基础,使其被越来越多的专家和学者所接纳,同时被广泛应用于工业生产、文本识别、图像分析、入侵检测、广告推荐、管理评估、金融保险、医疗诊断、生命科学等诸多领域。然而在现现实生活中,分类问题中的数据复杂性不断增加,如噪声样本对正常分类的干扰、非均衡数据带来的分类倾向性改变,这些问题的存在使得经典支持向量机分类精度下降。为了更好地将支持向量机应用于实际问题当中,需要结合支持向量机自身性质,充分考虑噪声样本和非均衡数据给分类结果带来的影响,深入分析分类精度下降的原因,从而有针对性地对经典支持向量机模型加以改进,进一步拓宽支持向量机的理论价值和应用价值。本文系统地研究了经典支持向量机的相关理论及其性质,针对支持向量机中的噪声问题和数据非均衡问题分别进行了讨论,并提出同时解决噪声和非均衡数据的改进支持向量机算法,将其应用到小额贷款公司客户信用风险评估的实际案例当中,违约客户识别率有所提高。本文的主要研究内容如下:(1)引入灰色关联度,定义了样本的平均灰色绝对关联度;针对噪声识别过程中支持向量对分类贡献被削弱的问题,提出了基于同类中心和异类中心双参照点的噪声判别方法;给出新的隶属度函数设置具体步骤。(2)针对传统SMOTE算法在处理非均衡数据时对全部少数类样本操作的问题,提出仅对错分样本人工合成的改进思想;引入Random-SMOTE算法,改善新合成样本的分布情况;给出具体非均衡数据下的改进支持向量机算法流程。(3)分析了在使用SMOTE过程中噪声对分类结果的影响;提出一种新型支持向量机算法,首先使用双参照点灰色关联度的噪声判别方法对样本进行筛选,再通过改进SMOTE算法合成新样本;给出组合算法的流程。(4)研究了小额贷款公司对客户进行信用风险评估时面临的问题;构建了信用风险评估指标体系,给出真实案例背景下的各指标违约分布情况;将本文提出的改进支持向量机算法应用到具体数据当中,与其他算法对比违约客户的识别精度。
【关键词】:灰色关联度 SMOTE 支持向量机 非均衡数据 信用风险
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F832.39;F224.9
【目录】:
- 摘要4-5
- ABSTRACT5-11
- 第一章 绪论11-18
- 1.1 研究背景及意义11-13
- 1.1.1 研究背景11-12
- 1.1.2 研究意义12-13
- 1.2 国内外研究现状13-15
- 1.2.1 支持向量机发展回顾及研究现状13-15
- 1.2.2 信用风险评估研究现状15
- 1.2.3 现有文献综述15
- 1.3 研究内容15-16
- 1.4 研究思路与框架16-18
- 第二章 基于双参照点灰色关联度的模糊SVM分类模型研究18-28
- 2.1 引言18-19
- 2.2 问题的提出19-21
- 2.2.1 模糊支持向量机19-20
- 2.2.2 现有隶属度函数设计缺陷20-21
- 2.3 基于双参照点灰色关联度的模糊支持向量机改进方法21-25
- 2.3.1 灰色关联度22-23
- 2.3.2 样本平均关联度的确定23-24
- 2.3.3 基于双参照点样本隶属度的确定24-25
- 2.4 实验仿真25-27
- 2.5 本章小结27-28
- 第三章 基于改进SMOTE的非均衡数据SVM分类模型研究28-44
- 3.1 引言28
- 3.2 问题的提出28-33
- 3.2.1 SMOTE算法28-29
- 3.2.2 现有SMOTE算法的不足29-33
- 3.3 基于改进SMOTE的非均衡SVM分类算法33-37
- 3.3.1 Random-SMOTE33-34
- 3.3.2 改进SMOTE的支持向量机算法34-37
- 3.4 实验仿真37-42
- 3.4.1 精确度测量37-38
- 3.4.2 对比的方法38
- 3.4.3 实验与结果38-42
- 3.5 本章小结42-44
- 第四章 基于灰色关联度与改进SMOTE的SVM分类模型研究44-54
- 4.1 问题的提出44-45
- 4.2 基于灰色关联度与改进SMOTE的SVM分类算法45-48
- 4.2.1 噪声的处理45-46
- 4.2.2 含噪声的非均衡数据分类算法46-48
- 4.3 实验仿真48-53
- 4.4 本章小结53-54
- 第五章 小额贷款公司客户信用风险非均衡SVM分类实证研究54-61
- 5.1 引言54-55
- 5.2 数据来源55
- 5.3 信用风险评估指标构建55-59
- 5.4 结果与分析59
- 5.5 本章小结59-61
- 第六章 结论与展望61-63
- 6.1 结论61-62
- 6.2 展望62-63
- 参考文献63-68
- 致谢68-69
- 在学期间的研究成果及发表的学术论文69
【参考文献】
中国期刊全文数据库 前10条
1 朱双;周建中;孟长青;肖舸;陈健国;;基于灰色关联分析的模糊支持向量机方法在径流预报中的应用研究[J];水力发电学报;2015年06期
2 章少平;梁雪春;;优化的支持向量机集成分类器在非平衡数据集分类中的应用[J];计算机应用;2015年05期
3 张大斌;周志刚;许职;李延晖;;基于差分进化自动聚类的信用风险评价模型研究[J];中国管理科学;2015年04期
4 周华平;李敬兆;;多阶灰色支持向量机集成预测模型研究[J];计算机工程与科学;2015年03期
5 王鲜芳;王岁花;杜昊泽;王平;;基于模糊粗糙集和支持向量机的化工过程故障诊断[J];控制与决策;2015年02期
6 陈庭强;何建敏;;基于复杂网络的信用风险传染模型研究[J];中国管理科学;2014年11期
7 郭勤;贾振红;覃锡忠;盛磊;陈丽;;支持向量机补偿的多因素灰色模型话务量预测[J];计算机工程与科学;2014年07期
8 吕成戍;;基于代价敏感支持向量机的推荐系统托攻击检测方法[J];计算机工程与科学;2014年04期
9 宋李俊;赵虎;;基于融合特征与支持向量机的控制图模式识别[J];计算机应用研究;2014年03期
10 陈伟;贾庆轩;孙汉旭;;基于灰关联信息熵的SVM决策树轴承故障分类[J];振动.测试与诊断;2013年03期
本文关键词:基于灰色关联度与改进SMOTE的支持向量机建模与应用,,由笔耕文化传播整理发布。
本文编号:434604
本文链接:https://www.wllwen.com/jingjilunwen/guojijinrong/434604.html