当前位置:主页 > 科技论文 > 软件论文 >

离群检测模型在反洗钱中的应用研究

发布时间:2018-08-24 20:59
【摘要】:金融交易网络是一个非常复杂的图网络,要从交易网络中海量的、复杂的、含有噪声的数据集中挖掘出不同于其它数据对象的小模式,也就是金融交易网络和反洗钱研究里的嫌疑账户的确定,这可以转化为数据挖掘中离群检测的问题。传统的基于聚类的离群检测方法有两个很大的不足之处,一方面,对于类内的数据对象的差异,没有很好的模型进行分析,另一方面,对于类之间的联系,没有合适的发现方法。针对上述出现的问题,可以将聚类、局部离群检测和链接发现三者结合起来,结合相关的理论,给出一种完整离群检测模型方案。对每个交易账户,根据交易次数和交易金额规整原始数据为适合离群挖掘的数据集,建立该数据集时,要注意一些无效数据的剔除,使规整后的数据集更加具有有效性和完整性。采用改进的两步聚类算法对规整后的数据集进行聚类,将具有相似交易特征的账户划分为一类,该聚类算法有很好的聚类效果,也可以发现一些异常数据对象,聚类之后的数据集使之后的模型发现分析更加具有针对性,然后对每个聚类分别建立基于聚类的异常检测模型:对类内的账户差异,采用基于马氏距离的局部离群检测算法计算离群指数并以升序的方式呈现出来,对类之间的交易联系,采取基于图熵的链接发现技术对聚类后的交易网络进行约减,给出交易网络中关键的交易节点。并且通过两组对比实验验证了改进的两步聚类算法的聚类精度以及基于马氏距离的密度离群检测算法的准确率。结合项目金融交易分析系统,依照之前的研究,实现了一个离群检测模型模块,针对真实案件的数据进行有效性验证。
[Abstract]:The financial transaction network is a very complex graph network, it is necessary to mine the small pattern which is different from other data objects from the massive, complex, noisy data set in the transaction network. That is, the identification of suspected accounts in financial transaction networks and anti-money laundering studies, which can be translated into outlier detection in data mining. The traditional outlier detection method based on clustering has two great shortcomings. On the one hand, there is no good model to analyze the difference of data objects in the class; on the other hand, the relationship between the classes is analyzed. There is no suitable method of discovery. In view of the above problems, we can combine clustering, local outlier detection and link discovery, and give a complete outlier detection model. For each transaction account, according to the number of transactions and the amount of transactions, the original data is suitable for outlier mining. When setting up the data set, we should pay attention to the elimination of some invalid data. The structured data set is more effective and complete. The improved two-step clustering algorithm is used to cluster the regular data sets, and the accounts with similar transaction characteristics are divided into a class. The clustering algorithm has a good clustering effect, and some abnormal data objects can also be found. The data set after clustering makes the analysis of model discovery more specific. Then the anomaly detection model based on clustering is established for each cluster. The local outlier detection algorithm based on Markov distance is used to calculate the outlier index and present it in ascending order. The link discovery technology based on graph entropy is used to reduce the transaction network after clustering. The key transaction nodes in the trading network are given. The clustering accuracy of the improved two-step clustering algorithm and the accuracy of the density outlier detection algorithm based on Markov distance are verified by two sets of comparative experiments. Combined with the project financial transaction analysis system, according to the previous research, a outlier detection model module is implemented to verify the validity of the real case data.
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;D924.3

【相似文献】

相关期刊论文 前1条

1 卢正鼎,王琼;基于相似度的离群模式发现模型[J];华中科技大学学报(自然科学版);2005年01期

相关会议论文 前9条

1 张锋;常会友;;茫然第三方支持的隐私保持离群点探测协议[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

2 连凤娜;吴锦林;薛永生;;一种改进的基于距离的离群挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年

3 梁雪琴;刘红生;代秀梅;周亚芬;;聚类离群点挖掘技术在内部审计信息化中的应用——一个来自商业银行信用卡审计的实例[A];全国内部审计理论研讨优秀论文集(2013)[C];2014年

4 于浩;王斌;肖刚;杨晓春;;基于距离的不确定离群点检测[A];第26届中国数据库学术会议论文集(A辑)[C];2009年

5 许龙飞;熊君丽;段敏;;基于粗糙集的高维空间离群点发现算法研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

6 刘文远;李振平;王宝文;裴继辉;;一种多维数据的离群点检测算法[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年

7 魏藜;钱卫宁;周傲英;;HOT:寻找高维空间中的离群点[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

8 周红福;钱卫宁;魏藜;周傲英;;EDOLOIS:高效准确的子空间局部离群点发现[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

9 魏藜;钱卫宁;周傲英;;SLOT:基于估计的高效子空间局部离群点发现[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

相关博士学位论文 前10条

1 刘莘;基于时空分析的CCS泄漏预警关键技术研究[D];中国矿业大学;2016年

2 刘露;异质信息网络中离群点检测方法研究[D];吉林大学;2017年

3 杨鹏;离群检测及其优化算法研究[D];重庆大学;2010年

4 林海;离群检测及离群释义空间查找算法研究[D];重庆大学;2012年

5 薛安荣;空间离群点挖掘技术的研究[D];江苏大学;2008年

6 杨茂林;离群检测算法研究[D];华中科技大学;2012年

7 金义富;高维稀疏离群数据集延伸知识发现研究[D];重庆大学;2007年

8 雷大江;离群检测与离群释义算法研究[D];重庆大学;2012年

9 万家强;基于连通性的离群检测与聚类研究[D];重庆大学;2014年

10 唐向红;数据流离群点检测研究[D];华中科技大学;2010年

相关硕士学位论文 前10条

1 韩红霞;基于距离离群点的分析与研究[D];江苏大学;2007年

2 黄馨玉;基于邻域重心变化的离群点检测算法研究[D];辽宁大学;2015年

3 程百球;基于EP模式的离群点发现[D];安庆师范学院;2015年

4 欧阳根平;Hadoop云平台下基于离群点挖掘的入侵检测技术研究[D];电子科技大学;2015年

5 邓璇;数据流挖掘关键技术研究与实现[D];电子科技大学;2015年

6 周莹莹;利用离群点检测改进协同过滤推荐算法[D];南京邮电大学;2015年

7 陈娟;基于离群特征提取和能量计算的SVM股市预测研究[D];合肥工业大学;2014年

8 张友强;基于选择性集成学习的离群点检测研究[D];青岛科技大学;2016年

9 王美晶;基于PSO算法的离群点检测方法研究[D];福州大学;2013年

10 关皓文;基于离群点检测方法的医保异常发现[D];山东大学;2016年



本文编号:2202023

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2202023.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cd738***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com