基于数据挖掘的互联网金融反欺诈系统研究
本文关键词:基于数据挖掘的互联网金融反欺诈系统研究
更多相关文章: 互联网金融 风险 反欺诈系统 数据挖掘 机器学习
【摘要】:2015年,互联网金融的江湖风起云涌,牵动着每一位投资者的心弦。一方面,互联网金融打破了传统银行的壁垒,使得借贷者能够在线上直接实现融资,这种创新型金融模式给我国金融改革带来新的机遇,人们对互联网金融的发展也寄予了无限的期许。另一方面,与互联网金融有关的负面事件被频繁曝光,互联网金融的盈利模式备受质疑,而加强监管和降低风险将是互联网金融行业面临的首要难题。针对国内互联网金融的发展现状,抽丝剥茧将种类繁多的互联网金融产品分为三种模式:第一,传统金融的互联网化;第二,信息资金服务平台;第三,基于互联网平台开展传统金融业务。而互联网金融在高速发展的态势下,主要面临三类风险,信用风险、技术风险和监管风险。其中欺诈风险作为信用风险的主要表现形式,是互联网金融风控的关键环节,因此互联网金融反欺诈系统的建设迫在眉睫。借鉴国内外的研究成果,结合统计学和机器学习等学科知识,采用数据挖掘技术,提出了一套较为合理互联网金融的反欺诈系统。该反欺诈系统是由统计识别、模型识别、和人工识别三个模块组成,其中统计识别是采用统计方法收集、整理和分析原始数据;模型识别是使用机器学习算法,建立反欺诈模型,识别出有欺诈可能性的用户;人工识别是前两个模块的补充,对可能存在欺诈行为的用户再次审核。在反欺诈系统的理论框架下,本文以互联网金融的行业实际数据进行分析与建模。原始数据集中包含用户的消费数据、社交数据和信用数据(欺诈类型和正常类型)。基于数据挖掘方法的统计分析发现,用户的消费、社交与用户的信用类型存在一定的联系,并且用户的社交关系对用户信用有着显著影响。抽取部分训练集数据分别建立神经网络模型、支持向量机模型和随机森林模型,使用测试集数据进行验证,模型评估表明神经网络的预测效果最理想。最后,总结互联网金融反欺诈系统的研究成果,阐述研究中的不足之处,并且对建设互联网金融反欺诈系统给出合理的意见。
【关键词】:互联网金融 风险 反欺诈系统 数据挖掘 机器学习
【学位授予单位】:暨南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F724.6;F832.2
【目录】:
- 摘要3-4
- ABSTRACT4-8
- 1 绪论8-14
- 1.1 背景及意义8
- 1.2 国内外文献综述8-10
- 1.2.1 国外研究现状8-9
- 1.2.2 国内研究现状9-10
- 1.3 研究思路及内容10-12
- 1.4 研究方法和创新处12-14
- 2 互联网金融风控研究14-20
- 2.1 互联网金融的发展现状14-16
- 2.2 互联网金融风险16-20
- 2.2.1 互联网金融风险类型16-18
- 2.2.2 互联网金融风控模式18-20
- 3 互联网金融的反欺诈系统20-29
- 3.1 统计识别20-22
- 3.1.1 变量选择20-21
- 3.1.2 数据预处理21
- 3.1.3 相关性分析21-22
- 3.2 模型识别22-28
- 3.2.1 神经网络22-24
- 3.2.2 支持向量机24-25
- 3.2.3 随机森林25-26
- 3.2.4 模型评估26-28
- 3.3 人工识别28-29
- 4 实证研究与分析29-40
- 4.1 数据预处理及描述29-31
- 4.2 社交与信用的关系31-33
- 4.3 消费与信用的关系33-34
- 4.4 联网金融的反欺诈模型34-40
- 4.4.1 神经网络35-36
- 4.4.2 支持向量机36-37
- 4.4.3 随机森林37-39
- 4.4.4 模型风险比较39-40
- 5 结论及建议40-44
- 5.1 结论40-41
- 5.2 不足41-42
- 5.3 建议42-44
- 参考文献44-47
- 附录47-51
- 致谢51
【相似文献】
中国期刊全文数据库 前10条
1 韩海萌;信息时代的指南针——数据挖掘[J];江苏统计;2002年05期
2 韩双霞;李萍;;数据挖掘:构筑企业竞争优势[J];金卡工程;2002年08期
3 李菁菁,邵培基,黄亦潇;数据挖掘在中国的现状和发展研究[J];管理工程学报;2004年03期
4 ;中国科学院数据挖掘与知识管理学术研讨会在京举行[J];管理评论;2004年07期
5 李峰;数据挖掘在企业中的应用[J];商场现代化;2004年15期
6 魏瑜,陆静;数据挖掘与统计学的关系浅析[J];沿海企业与科技;2005年09期
7 罗锦珠;数据挖掘与知识管理的结合应用[J];技术经济;2005年10期
8 袁卫,林桢顺,谢邦昌;工业领域的数据挖掘——改善流程,提高效率[J];中国统计;2005年04期
9 王琳;;统计学方法在数据挖掘中的应用[J];当代经理人;2006年02期
10 刘晓华;;数据挖掘在商业中的应用[J];商场现代化;2006年34期
中国重要会议论文全文数据库 前10条
1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
中国博士学位论文全文数据库 前10条
1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年
2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年
3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年
4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年
5 邬文帅;基于多目标决策的数据挖掘方法评估与应用[D];电子科技大学;2015年
6 谢邦彦;整合数据挖掘与TRIZ理论的质量管理方法研究[D];首都经济贸易大学;2010年
7 何伟全;云南高校学生意外伤害因素关联规则挖掘及风险管控体系研究[D];昆明理工大学;2015年
8 段功豪;基于多结构数据挖掘的滑坡灾害预测模型研究[D];中国地质大学;2016年
9 白晓明;基于数据挖掘的复合材料宏—细观力学模型研究[D];哈尔滨工业大学;2016年
10 蓝永豪(LAM Wing Ho);基于数据挖掘技术分析当代中医名家痤疮验方经验研究[D];南京中医药大学;2016年
中国硕士学位论文全文数据库 前10条
1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年
2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年
3 焦亚召;基于多核函数FCM算法在数据挖掘聚类中的应用研究[D];昆明理工大学;2015年
4 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年
5 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年
6 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年
7 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年
8 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年
9 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年
10 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年
,本文编号:856356
本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/856356.html