基于AdaBoost-SVM的网络借贷违约预测系统的设计与实现
发布时间:2020-07-27 19:22
【摘要】:随着计算机网络安全水平的不断提高和互联网的迅速发展,P2P网络借贷正在不断侵蚀着中国互联网市场,发展势头迅猛异常。它是一种独立于互联网金融机构系统的个人对个人贷款模式。虽然P2P网络借贷的发展带来了巨大的经济效益,但同时也暴露出一系列的问题。由于P2P网络借贷平台其平台运作的缺陷,在整个借贷过程中缺乏第三方机构的参与,出借方对风险的评估主要依据个人信用。但由于我国缺乏有效合理的监管制度和相关的监管平台,再加之借款人相关的信用信息收集系统不完备,造成借款人逾期违约行为频繁发生。因此,在这一背景下从网络借贷数据出发,利用数据挖掘算法分析数据特征对借贷结果的影响,使提取的特征在实际分类预测中具有较好的可靠性和敏感性。本文使用支持向量机(SVM)作为分类器,研究表明,不仅特征选择会很大程度上影响支持向量机的分类效果,同时恰当的支持向量机惩罚参数和核函数参数也可以提高分类效果。采用粒子群算法(PSO)对支持向量机参数进行优化,并提出了一种改进的粒子群优化算法。基于改进的粒子群优化算法优化支持向量机基分类器的模型参数,然后采用AdaBoost算法对以上优化的SVM基分类器进行迭代集成,创建了基于多分类器优化集成的网络借贷违约预测模型。以Lending Clud借贷数据集为研究对象,进行网络借贷违约预测模型建模,实验结果表明,与标准的SVM算法、PSO-SVM算法、决策树算法(CART)和随机森林算法(RandomForest)相比,AdaBoost与SVM的结合使用有效地提高了整个样本的分类准确率和泛化率,利用该模型进行的网络借贷违约预测的准确性明显优于其他模型。最后本文在该模型的基础上,设计和实现了基于AdaBoost与SVM的网络借贷违约预测系统。经过独立测试集验证,系统能够较为准确的进行预测,精确度达到92.5%。在功能上和性能上都能满足系统需求,达到预期研究效果。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F713.36;F830.5;TP18
【图文】:
图 2-1 最优分类面示意图Figure 2-1 Optimal classification plane可分支持向量机分支持向量机是用来解决样本集线性可分问题的分类问的训练样本集,可以通过构造具有区间最大化的相应凸二类超平面: + = 0号函数 sign 的作用,得到相应的分类决策函数:f( ) = ( + )为样本集线性可分支持向量机,其中 为权重系数, 该分类超平面能够最大限度并正确划分训练数据集,则需可以把问题抽象为如下的数学表达式:
将每个粒子的当前位置设置为个体极值,使用适应度函数度值,取适应度好的那个粒子做个体最优值,对应的把该局最优值;按照粒子的位置和速度更新公式更新粒子的位置和速度;按照粒子的适应度函数计算每次迭代后每个粒子的适应度将个体最优值的适应度值与每个粒子的适应度值比较,如新个体最优值,否则保留原先值;将全局最优值比较与更新后的每个粒子的个体最优值比较则更新全局最优值,否则保留原先值;判断是否满足终止条件,若所得解已经达到了预期的效果,就终止迭代,否则返回 Step 3;法流程如图 2-2 所示:
图 2-3 AdaBoost 算法过程示意图Figure 2-3 AdaBoost algorithm process diagram2.5 本章小结本章主要对课题研究所需的的基础理论及相关技术进行全面、深入的阐述与分析。首先,介绍了 P2P 网路借贷的基本理论、特征、运行模式等。其次,对支持向量机、粒子群算法和 AdaBoost 算法的原理进行较全面的介绍。为网络借贷违约预测系统的设计与实现打下坚实的理论基础。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F713.36;F830.5;TP18
【图文】:
图 2-1 最优分类面示意图Figure 2-1 Optimal classification plane可分支持向量机分支持向量机是用来解决样本集线性可分问题的分类问的训练样本集,可以通过构造具有区间最大化的相应凸二类超平面: + = 0号函数 sign 的作用,得到相应的分类决策函数:f( ) = ( + )为样本集线性可分支持向量机,其中 为权重系数, 该分类超平面能够最大限度并正确划分训练数据集,则需可以把问题抽象为如下的数学表达式:
将每个粒子的当前位置设置为个体极值,使用适应度函数度值,取适应度好的那个粒子做个体最优值,对应的把该局最优值;按照粒子的位置和速度更新公式更新粒子的位置和速度;按照粒子的适应度函数计算每次迭代后每个粒子的适应度将个体最优值的适应度值与每个粒子的适应度值比较,如新个体最优值,否则保留原先值;将全局最优值比较与更新后的每个粒子的个体最优值比较则更新全局最优值,否则保留原先值;判断是否满足终止条件,若所得解已经达到了预期的效果,就终止迭代,否则返回 Step 3;法流程如图 2-2 所示:
图 2-3 AdaBoost 算法过程示意图Figure 2-3 AdaBoost algorithm process diagram2.5 本章小结本章主要对课题研究所需的的基础理论及相关技术进行全面、深入的阐述与分析。首先,介绍了 P2P 网路借贷的基本理论、特征、运行模式等。其次,对支持向量机、粒子群算法和 AdaBoost 算法的原理进行较全面的介绍。为网络借贷违约预测系统的设计与实现打下坚实的理论基础。
【相似文献】
相关期刊论文 前9条
1 杨云;卢美静;穆天红;;基于AdaBoost-SVM的葡萄酒品质分类模型优化设计[J];陕西科技大学学报(自然科学版);2017年01期
2 降爱莲;杨兴彤;;基于AdaBoost-SVM级联分类器的行人检测[J];计算机工程与设计;2013年07期
3 杨振军;苏忠亭;王伟;王琳;;基于AdaBoost-SVM算法的某火炮炮闩技术状态评估[J];装甲兵工程学院学报;2012年02期
4 高荣星;魏骁勇;王俊峰;;一种基于Adaboost-SVM的高层次语义概念提取方法[J];计算机应用与软件;2012年04期
5 钱揖丽;冯志茹;;利用AdaBoost-SVM集成算法和语块信息的韵律短语识别[J];计算机工程与科学;2015年12期
6 王露茜;王嘉e
本文编号:2772267
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2772267.html