离群检测模型在反洗钱中的应用研究
[Abstract]:The financial transaction network is a very complex graph network, it is necessary to mine the small pattern which is different from other data objects from the massive, complex, noisy data set in the transaction network. That is, the identification of suspected accounts in financial transaction networks and anti-money laundering studies, which can be translated into outlier detection in data mining. The traditional outlier detection method based on clustering has two great shortcomings. On the one hand, there is no good model to analyze the difference of data objects in the class; on the other hand, the relationship between the classes is analyzed. There is no suitable method of discovery. In view of the above problems, we can combine clustering, local outlier detection and link discovery, and give a complete outlier detection model. For each transaction account, according to the number of transactions and the amount of transactions, the original data is suitable for outlier mining. When setting up the data set, we should pay attention to the elimination of some invalid data. The structured data set is more effective and complete. The improved two-step clustering algorithm is used to cluster the regular data sets, and the accounts with similar transaction characteristics are divided into a class. The clustering algorithm has a good clustering effect, and some abnormal data objects can also be found. The data set after clustering makes the analysis of model discovery more specific. Then the anomaly detection model based on clustering is established for each cluster. The local outlier detection algorithm based on Markov distance is used to calculate the outlier index and present it in ascending order. The link discovery technology based on graph entropy is used to reduce the transaction network after clustering. The key transaction nodes in the trading network are given. The clustering accuracy of the improved two-step clustering algorithm and the accuracy of the density outlier detection algorithm based on Markov distance are verified by two sets of comparative experiments. Combined with the project financial transaction analysis system, according to the previous research, a outlier detection model module is implemented to verify the validity of the real case data.
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;D924.3
【相似文献】
相关期刊论文 前1条
1 卢正鼎,王琼;基于相似度的离群模式发现模型[J];华中科技大学学报(自然科学版);2005年01期
相关会议论文 前9条
1 张锋;常会友;;茫然第三方支持的隐私保持离群点探测协议[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 连凤娜;吴锦林;薛永生;;一种改进的基于距离的离群挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
3 梁雪琴;刘红生;代秀梅;周亚芬;;聚类离群点挖掘技术在内部审计信息化中的应用——一个来自商业银行信用卡审计的实例[A];全国内部审计理论研讨优秀论文集(2013)[C];2014年
4 于浩;王斌;肖刚;杨晓春;;基于距离的不确定离群点检测[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
5 许龙飞;熊君丽;段敏;;基于粗糙集的高维空间离群点发现算法研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 刘文远;李振平;王宝文;裴继辉;;一种多维数据的离群点检测算法[A];2007年全国第十一届企业信息化与工业工程学术会议论文集[C];2007年
7 魏藜;钱卫宁;周傲英;;HOT:寻找高维空间中的离群点[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
8 周红福;钱卫宁;魏藜;周傲英;;EDOLOIS:高效准确的子空间局部离群点发现[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 魏藜;钱卫宁;周傲英;;SLOT:基于估计的高效子空间局部离群点发现[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
相关博士学位论文 前10条
1 刘莘;基于时空分析的CCS泄漏预警关键技术研究[D];中国矿业大学;2016年
2 刘露;异质信息网络中离群点检测方法研究[D];吉林大学;2017年
3 杨鹏;离群检测及其优化算法研究[D];重庆大学;2010年
4 林海;离群检测及离群释义空间查找算法研究[D];重庆大学;2012年
5 薛安荣;空间离群点挖掘技术的研究[D];江苏大学;2008年
6 杨茂林;离群检测算法研究[D];华中科技大学;2012年
7 金义富;高维稀疏离群数据集延伸知识发现研究[D];重庆大学;2007年
8 雷大江;离群检测与离群释义算法研究[D];重庆大学;2012年
9 万家强;基于连通性的离群检测与聚类研究[D];重庆大学;2014年
10 唐向红;数据流离群点检测研究[D];华中科技大学;2010年
相关硕士学位论文 前10条
1 韩红霞;基于距离离群点的分析与研究[D];江苏大学;2007年
2 黄馨玉;基于邻域重心变化的离群点检测算法研究[D];辽宁大学;2015年
3 程百球;基于EP模式的离群点发现[D];安庆师范学院;2015年
4 欧阳根平;Hadoop云平台下基于离群点挖掘的入侵检测技术研究[D];电子科技大学;2015年
5 邓璇;数据流挖掘关键技术研究与实现[D];电子科技大学;2015年
6 周莹莹;利用离群点检测改进协同过滤推荐算法[D];南京邮电大学;2015年
7 陈娟;基于离群特征提取和能量计算的SVM股市预测研究[D];合肥工业大学;2014年
8 张友强;基于选择性集成学习的离群点检测研究[D];青岛科技大学;2016年
9 王美晶;基于PSO算法的离群点检测方法研究[D];福州大学;2013年
10 关皓文;基于离群点检测方法的医保异常发现[D];山东大学;2016年
,本文编号:2202023
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2202023.html