当前位置:主页 > 管理论文 > 信贷论文 >

基于CNN-XGBoost的互联网金融防欺诈问题的实证研究

发布时间:2021-04-13 19:12
  金融欺诈检测的目的是预测潜在的欺诈用户和欺诈行为,减少金融机构损失。随着互联网金融的快速发展,对金融反欺诈方案的需求愈发迫切。机器学习方法在欺诈检测中的应用十分广泛。模型和神经网络都是重要的分类方法,树模型可解释性更强,但分类效果十分依赖于手动设计的特征,神经网络可以自动实现特征提取,但更易过拟合。因此本文结合了这两种算法的优势,对卷积神经网络CNN与XGBoost的组合进行了研究。XGBoost是一种常用的分类方法,XGBoost引入了正则化项控制模型复杂度,大幅提升了模型的抗过拟合能力。相较于传统树模型的效果提升十分明显,但XGBoost仍然依赖于人工进行特征工程处理。CNN能自动完成特征提取,对数据中的重要特征在高维空间进行组合和筛选,但随着特征抽象程度的提高,过拟合现象大幅影响了网络的表现。本文将CNN中的低抽象度特征加入到原始特征中训练XGBoost,同时利用了 CNN自动实现特征提取的特点和XGBoost抗过拟合的特点,提高了模型拟合的上界。本文主要工作如下:(1)对数据进行预处理和先验分析。基于正负样本比例接近1:12的信用卡欺诈数据,对原始数据进行探索性分析,通过可视化... 

【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

基于CNN-XGBoost的互联网金融防欺诈问题的实证研究


图2.1神经网络示意图??

示意图,感受野,示意图,卷积


佳的效果,从此不少学者开始重视CNN的研究[25:。??CNN具有多层结构、池化操作、局部连接及权值共享这四个特点。在传统的神经网??络中,全连接层中的神经元之间互相连接,使得参数太多,训练过程耗时长且容易??过拟合。而CNN利用了局部感受野与权值共享的两大特性,共享权重和偏置值,大??大减少网络训练的参数,降低网络训练的复杂度[26。??感受野的定义为,卷积神经网络中每层输出的特征图上像素点在原始图像中映??射区域的大小,利用局部感受野,每个神经元只需感知图像的局部[27:。??图2.?2感受野示意图??计算感受野时从最后一层开始计算,再逐层传递至第一层,计算公式为:??RFj?=?(RFj+i?-?l)?x?stridej?+?Ksizej?(2.?27)??巧为第j层卷积层的感受野,/^.+1为第j+1层上的感受野。Ksize为本层卷积核??大小,stride为卷积步长。在感受野的计算中,最后一层输出特征图的感受野大小??与卷积核大小相等,第j层卷积层感受野的大小不仅与第j层的卷积步长和卷积核??大小有关,还与第j+1层感受野的大小有关。另外,在计算感受野时不考虑padding??的大小,也就是忽略图像边缘的影响。在一张图像中,局部像素之间密切相关。在??隐藏层中,图像的局部相关与神经元的局部连接能极大地减少参数数目,隐藏层中??的神经元只需要与感受野区域连接。另外,隐藏层中神经元之间的权值共享也能减??少参数数目。??CNN的常用结构一般由卷积层、池化层和全连接层组成。其中,卷积层是卷积神??经网络中最核心最关键的部分,用于提取特征,池化层用于降维,能减少网络中参??数数量,全连接层一般位于网络的最后,用做

流程图,组合模型,流程,卷积


果??个??XGBoost?训练?(f?)??新的特证数据?c?...)(-...)…r-...'-?)?:::::::??、?,、?^?J?X?M?U?M?M?????zl?x2x3?????xji??全连掊层?(?)?原始特证教据??/????信息提取?(....?)?c?...?)??…r' ̄r ̄")??隹积层?(个)??r%?r%?rv?rv?rv?rv??原始特征數裾??vy?kJ?Lx??xl?x2x3?…?xn??图2.?3?CNN-XGBoost组合模型训练流程??2.?3.1?I?ncept?i?on?网络??在标准的卷积神经网络中,网络的每一层都从之前的层中提取信息,从而将输??入数据转换为更有用的信息,但是类型不同的层提取的特征种类也不同。Inception??模型能对这些不同的变换结果并行计算,它是一种具有优良结构的网络,其局部拓??扑结构能对输入数据并行执行多个池化操作或卷积运算,并将所有的输出结果拼接??在一起形成一个特征图。Inception在同一层级上运行了滤波器尺寸为1?x?1,3?x?3,??5x5,?7x7的卷积层,将不同滤波器尺寸的卷积组合在一起,经过卷积操作后,输??出的结果再全部整合在一起,而选择不同尺寸的滤波器的目的在于收集上一层输入??13??

【参考文献】:
期刊论文
[1]基于SMOTE和XGBoost的贷款风险预测方法[J]. 刘斌,陈凯.  计算机与现代化. 2020(02)
[2]SMOTE混合抽样对非平衡数据分类效果的影响分析[J]. 王蕾,刘赛可,夏利宇.  调研世界. 2020(01)
[3]缺失数据的处理方法及其发展趋势[J]. 邓建新,单路宝,贺德强,唐锐.  统计与决策. 2019(23)
[4]互联网金融背景下银行信用卡欺诈与套现风险防控研究[J]. 张越.  时代金融. 2019(11)
[5]局部感受野的宽度学习算法及其应用[J]. 李国强,徐立庄.  计算机工程与应用. 2020(09)
[6]结合Inception模型的卷积神经网络图像去噪方法[J]. 李敏,章国豪,曾建伟,杨晓锋,胡晓敏.  计算机工程与应用. 2019(20)
[7]神经网络模型在银行互联网金融反欺诈中的应用探索[J]. 李赟妮.  金融科技时代. 2018(08)
[8]基于Mini-batch神经网络的船舶柴油机风险等级预测[J]. 尚前明,王潇,曹召,刘治江,邓晓光.  中国修船. 2018(04)
[9]基于规则引擎的互联网金融反欺诈研究[J]. 丁濛濛.  电脑知识与技术. 2018(01)
[10]互联网金融违约欺诈风险事件研究[J]. 杨荻.  经济研究参考. 2016(63)

硕士论文
[1]基于大数据的互联网金融欺诈行为识别研究[D]. 丁爽斯.首都经济贸易大学 2016
[2]多标签分类中标签编码算法研究[D]. 曹蕾.南京师范大学 2015



本文编号:3135856

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/bankxd/3135856.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b5cfa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com