当前位置:主页 > 经济论文 > 国际贸易论文 >

基于时序不均衡数据的在线交易欺诈检测研究

发布时间:2020-06-19 01:13
【摘要】:由于近几年计算机处理能力的提升和数据科学的进步,推动了互联网的快速发展,以第三方支付服务为代表的在线交易模式已成为人们主流的消费方式之一,每时每刻来自互联网各个角落的人们通过这种基于网络的在线交易平台进行着成千上万的交易。而随着在线交易支付订单规模扩大和总交易金额的大幅度提升,各种类型的在线交易欺诈行为也越来越普遍。在线交易风险管理一直以来是业界十分关注的问题,而作为风险管理的重要组成部分,研究在线交易风险识别具有十分重要的现实意义。在线交易欺诈行为有发生频次低、造成危害大等特征,一般的反欺诈手段难以进行有效的识别并加以防范,随着机器学习与数据挖掘相关技术趋于成熟,将其应用于在线交易风险识别已成为近几年相关领域的研究趋势。在有关在线交易风险识别的研究中,其主要的难点有两个方面:首先是欺诈行为只占所有交易行为的很小一部分,数据类别分布存在高度的不均衡性,其不均衡比例甚至可达万分之一,而且部分欺诈类样本与正常样本的特征信息存在高度的相似性,使得普通的分类方法难以有效识别这类欺诈行为,因此需要利用不均衡数据分类的方法来对其进行有效的识别检测。其次,欺诈行为是具有时效性的,由于欺诈平台或者是欺诈团伙为了应对反欺诈措施会不断更改其作案方式,因此造成分类器无法适应新的特征规则,进而导致其无法对欺诈行为进行有效识别,即概念漂移现象。针对在线交易欺诈检测中的类别不均衡分布以及数据流概念漂移两个主要问题,本文在结合前人研究成果的基础上,提出了基于XGBoost和SMOTE技术的改进算法M-XGB-SMOTE,其核心思想是结合XGBoost算法较强的二分类能力和SMOTE泛化能力强的优点,以AUROC评估分数为指标从多轮重采样训练分类器中筛选分类器,并基于上述分类器构建集成分类结果的预测模型,以期提升模型预测的综合性能。在以上算法构建的基础上,提出了基于历史样本抽样递减规律的算法MS-XGB-SMOTE,以期利用历史样本随时间推移重要性递减的规律减少模型受到数据流概念漂移带来的负面影响。在基于交易风险识别数据集的实验环节中,与传统的分类算法比较中可以看出,M-XGB-SMOTE的AUC综合指标显著高于其他算法的结果;在与传统不均衡数据流分类算法的比较中可以看出,MS-XGBSMOTE算法的综合预测能力有明显提升。
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP181;F724.6;F832.2
【图文】:

技术路线图,技术路线,论文,不均衡


8图 1-1 论文技术路线1.4 论文结构本文主要由六章组成,本章主要介绍了在线交易欺诈检测的研究背景,以及相关领域的国内外研究现状,包括不均衡数据分类,数据流分类以及欺诈检测问题,并介绍了本文的主要研究内容及工作。第二章首先针对不均衡数据分类的相关理论进行详细的介绍,包括不均衡数据分类主要的研究方法,数据挖掘中传统分类器的基础理论。其次介绍了在线数据流的基本概念和特性,在此基础上结合不均衡数据分类问题,介绍了不均衡数据流分类问题中的主要解决方法,最后介绍了面向不均衡数据分类的评价标准。第三章首先介绍了本文研究使用数据集的背景以及原始信息,其次根据数据预处理的流程对数据进行了清洗,最后基于树模型分类器评估数据集所有特征的

集成学习,模型结构


电子科技大学硕士学位论文2.3.4 集成学习技术集成学习技术,也被很多学者称之为多分类器系统,是一类常见的机器学习算法。其主要思想是在一定的规则下创建多个子分类器(一般为弱分类器),并根据某种规则对这些子分类器进行组合构建,最终整合得到一个基于弱分类器集成的强分类器。除了直接将集成学习技术应用不均衡数据分类问题,将重采样技术或是代价敏感学习法与集成学习算法相结合,也是一种解决不均衡数据分类问题的主要方法[47]。集成学习的常用算法主要为:Boosting、Bagging 以及在 Bagging 思想上的扩展算法随机森林,以下是相关的原理介绍:

【参考文献】

相关期刊论文 前7条

1 陈斌;苏一丹;黄山;;基于KM-SMOTE和随机森林的不平衡数据分类[J];计算机技术与发展;2015年09期

2 陶新民;郝思媛;张冬雪;徐鹏;;不均衡数据分类算法的综述[J];重庆邮电大学学报(自然科学版);2013年01期

3 陈建增;;第三方支付业务的反欺诈措施与技术探析[J];时代金融;2012年21期

4 于化龙;高尚;赵靖;秦斌;;基于过采样技术和随机森林的不平衡微阵列数据分类方法研究[J];计算机科学;2012年05期

5 陶新民;刘福荣;童智靖;杨立标;;不均衡数据下基于SVM的故障检测新算法[J];振动与冲击;2010年12期

6 夏国恩;;客户流失预测的现状与发展研究[J];计算机应用研究;2010年02期

7 王和勇;樊泓坤;姚正安;;SMOTE和Biased-SVM相结合的不平衡数据分类方法[J];计算机科学;2008年05期

相关会议论文 前1条

1 曹璨;王鹏;黄海;陈宗海;;不均衡数据下的电信客户流失方法研究综述[A];第17届中国系统仿真技术及其应用学术年会论文集(17th CCSSTA 2016)[C];2016年

相关博士学位论文 前1条

1 曹鹏;不均衡数据分类方法的研究[D];东北大学;2014年

相关硕士学位论文 前2条

1 杨屹;基于稀有类分类的信用卡欺诈识别研究[D];北京工商大学;2013年

2 董燕杰;不平衡数据集分类的Random-SMOTE方法研究[D];大连理工大学;2009年



本文编号:2720095

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2720095.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户be1d6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com