当前位置:主页 > 管理论文 > 信贷论文 >

基于数据挖掘的商户套用欺诈检测研究与应用

发布时间:2017-10-28 18:17

  本文关键词:基于数据挖掘的商户套用欺诈检测研究与应用


  更多相关文章: 数据挖掘 欺诈检测 商户类别码 逻辑回归 Hadoop


【摘要】:随着电子商务不断发展,人们出门不再携带大额现金,更多的是刷卡消费,这带动了越来越多商户办理了POS机。收费机构在不同行业的POS机上所提取的费率也不一样。第三方支付机构根据商户所经营的行业主要营业收入为商户拟制一个类别码--商户类别码(Merchant Category Code),中国银联就是根据商户类别码收取不同手续费。因此衍生出了套用商户类别码的违法行为。“商户类别码套用”是指第三方支付机构套用商户类别码享受低手续费率的行为。欺诈检测作为目前国内外研究热点,是金融领域的一个重要课题。为此本文主要做了以下工作:1)基于商户类别码的标准行为模式库建立本文将不同的行业有不同的营业时间区间、营业高峰或者低谷等的现象称为该行业的“行为模式”。不同商户类别码的行为模式不同,本文采用机器学习的层次聚类算法,得到同一个商户类别码下具有代表性的N个行为模式。2)商户套用欺诈检测模型的建立。本文利用商户的交易行为与商户信息提取特征。在分类器选择上面,本文采用概率分类器—逻辑斯蒂回归解决该类问题。通过实验结果也表明了利用本文的检测方法,准确率,召回率均在80%以上,同时,即使训练样本数据量较少的情况下,该分类器准确率,召回率也没有很大的降低。3)欺诈检测模型的分布式实现。面对爆炸式增长的数据需求,分布式计算是未来大数据发展的重要方向。因此,基于这方面的要求,本文设计了商户类别码欺诈模型的分布式版本,即利用Hadoop平台,通过HDFS分布式文件系统存储海量数据文件,并使用Map Reduce计算模型并行计算提高检测效率,包括如何上传数据到HDFS,然后如何利用三个Job对原始数据进行预处理,以及最后如何设计分类器,本文都进行了详细介绍。综上所述,本文所提出的商户类别码欺诈检测模型,不但具有优秀的准确率,也具有良好的时间效率。本文的研究不但解决了实际问题,也为其他金融领域的大数据问题提供了很好的借鉴意义。
【关键词】:数据挖掘 欺诈检测 商户类别码 逻辑回归 Hadoop
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F832.2;TP311.13
【目录】:
  • 摘要5-6
  • ABSTRACT6-9
  • 第一章 绪论9-15
  • 1.1 研究背景9-11
  • 1.1.1 商户类别码套用欺诈来源9-10
  • 1.1.2 商户类别码欺诈的特点及危害10-11
  • 1.2 课题研究背景11-12
  • 1.3 本文的研究内容与创新12-14
  • 1.4 本论文的结构安排14-15
  • 第二章 相关理论与研究15-24
  • 2.1 数据挖掘基本理论15-16
  • 2.1.1 数据挖掘概念15
  • 2.1.2 数据挖掘步骤15-16
  • 2.2 数据挖掘主要研究内容16-19
  • 2.2.1 分类任务16-17
  • 2.2.2 聚类任务17-18
  • 2.2.3 关联分析18
  • 2.2.4 回归分析18-19
  • 2.3 HADOOP理论19-23
  • 2.3.1 HADOOP架构19-20
  • 2.3.2 HDFS简介20-23
  • 2.3.3 MapReduce简介23
  • 2.4 本章小结23-24
  • 第三章 商户套用欺诈检测模型设计24-45
  • 3.1 商户套用欺诈检测模型介绍24
  • 3.2 商户套用欺诈检测模型构建24-44
  • 3.2.1 数据预处理26-33
  • 3.2.2 获取标准行为模式模块33-38
  • 3.2.3 分类器训练模块38-44
  • 3.2.4 分类器分类模块44
  • 3.3 本章小结44-45
  • 第四章 商户类别码欺诈检测模型分布式实现45-59
  • 4.1 商户套用欺诈检测模型分布式设计45-46
  • 4.2 单机训练标准行为模式库46-50
  • 4.3 单机训练分类器50-51
  • 4.4 上传数据到HDFS51-53
  • 4.5 数据预处理分布式化53-57
  • 4.6 分类器分类分布式化57-58
  • 4.7 本章小结58-59
  • 第五章 实验结果与分析59-69
  • 5.1 实验环境59
  • 5.2 实验数据59-60
  • 5.3 实验结果60-68
  • 5.3.1 模型评价指标60-62
  • 5.3.2 模型的检测结果与分析62-68
  • 5.3.2.1 算法优越性分析62-66
  • 5.3.2.2 时间优越性分析66-68
  • 5.4 本章小结68-69
  • 第六章 总结与展望69-71
  • 6.1 本文的主要贡献69-70
  • 6.2 工作展望70-71
  • 致谢71-72
  • 参考文献72-75
  • 攻读硕士学位期间取得的成果75-76

【参考文献】

中国期刊全文数据库 前9条

1 徐U,

本文编号:1109396


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/bankxd/1109396.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cf83e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com