基于资金交易的金融领域犯罪团伙识别系统的设计与实现
发布时间:2020-03-24 13:02
【摘要】:随着互联网金融的迅猛发展,金融领域的相关业务对信息技术有越来越多的利用,但也造成了很多安全问题,如洗钱犯罪。基于资金交易的洗钱团伙,或是通过掩盖非法所得,将腐败资金转移境外,导致社会财富外流,或是为其他违法犯罪集团提供资金,助长违法犯罪,诸如此类的行为,严重危害到金融安全,动摇社会信用、破坏社会稳定。如何通过资金交易数据从庞大的客户群体中识别出可疑犯罪团伙,已成为国内外专家的研究重点。针对金融领域洗钱犯罪团伙识别的研究,主要分为两部分。一是基于资金交易特征建立犯罪团伙模型,二是利用社区发现识别可疑犯罪团伙。然而现阶段建模的研究主要依靠对银行等金融机构给出的可疑交易报告,没有充分利用金融交易的大数据;利用社区发现技术进行基于资金交易的犯罪团伙识别又存在算法复杂度过高,运行效率慢的问题。本文针对这些不足,对基于资金交易的犯罪团伙识别进行了深入研究。具体工作包括:(1)针对人工分析报告的不足,收集大量的金融交易数据,将不同客户间资金交易的关系,包括资金交易的数额和频率、资金交易的路径等进行特征提取和原始数据预筛除,并主要针对资金交易的数额和频率属性,提出了一种新的资金交易权值计算方式。(2)针对基于模块度的Louvain-Method社区发现算法在效率方面的问题提出了并行化优化方案,在保持原有算法的高准确性的基础上提升了算法的运行速度。在实施Louvain-Method算法并行化优化的过程中,本文运用基于图着色的分割算法和虚节点的思想解决了图划分过程中造成的节点间信息丢失的问题,对于本地移动过程中产生的“社区互换”、“描述滞后”的问题,也给出了相应的解决方案。(3)根据提出的新的权值计算方式和改进的基于模块度Louvain-Method 社区发现算法,实现了一个基于资金交易的金融网络犯罪团伙识别系统,该系统搭建在hadoop分布式集群上,应用MapReduce编程模型,在实际场景对大规模复杂金融交易网络数据集进行测试验证,对实验过程的速度和准确性做出定量分析比对,证明本文论述的基于资金交易的金融网络犯罪团伙识别方案具有更好的有效性和准确性。
【图文】:
逡逑金融交易网络结构的存储方式,一般采用邻接矩阵表示方法。邻表示网络结构的一种矩阵[19],它可以定义为:逡逑A「.邋q邋h邋若卜以]或(vi(Vj)邋e邋E(G)逡逑,J邋|0逦若[Vi,Vj]或(Vi,Vj)这邋E(G)中Wij表示节点i和节点j之间的连接强度,,也称为权值。对于邻接点:逡逑无向图当中,邻接矩阵一定是对称的。逡逑无向图当中,对应邻接矩阵的第i行或者第i列所有非零的值的应网络当中节点i的度;在有向图当中,对应邻接矩阵的第i行所数表示了对应网络当中节点i的出度,对应邻接矩阵的第i列所有表示了对应网络当中节点i的入度。逡逑文通过不同方面的权值综合计算加权,得出最终金融交易网络所需以此权值构成邻接矩阵,然后构造该矩阵对应的网络结构。例如:逡逑接矩阵与对应网络如图2-1所示:逡逑
象与多个风险对象具有风险联系,则其风险概率为1-(1-r2Xl-A+OG-A+^Xl-逡逑A'+n)。逡逑以图2-2为例,图中两个黑色区域表示已被感染(即己确定为风险对象),逡逑其风险概率为1,其余绿色区域被感染概率则为其中对应数值。其感染概率与传逡逑播的扩散系数有关,以该图为例。每条边对应的是已感染对象传播过程中对其周逡逑边对象感染的概率(即扩散系数),单体被感染的情况比较好理解。逡逑对于交叉感染(图2-2中间部分0.58项对象)的情况分析:对于左侧己感染逡逑对象,它对目标感染概率为0.4,则不感染的概率为1-0.4即0.6,右侧己感染对逡逑8逡逑
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:D917;TP301.6
【图文】:
逡逑金融交易网络结构的存储方式,一般采用邻接矩阵表示方法。邻表示网络结构的一种矩阵[19],它可以定义为:逡逑A「.邋q邋h邋若卜以]或(vi(Vj)邋e邋E(G)逡逑,J邋|0逦若[Vi,Vj]或(Vi,Vj)这邋E(G)中Wij表示节点i和节点j之间的连接强度,,也称为权值。对于邻接点:逡逑无向图当中,邻接矩阵一定是对称的。逡逑无向图当中,对应邻接矩阵的第i行或者第i列所有非零的值的应网络当中节点i的度;在有向图当中,对应邻接矩阵的第i行所数表示了对应网络当中节点i的出度,对应邻接矩阵的第i列所有表示了对应网络当中节点i的入度。逡逑文通过不同方面的权值综合计算加权,得出最终金融交易网络所需以此权值构成邻接矩阵,然后构造该矩阵对应的网络结构。例如:逡逑接矩阵与对应网络如图2-1所示:逡逑
象与多个风险对象具有风险联系,则其风险概率为1-(1-r2Xl-A+OG-A+^Xl-逡逑A'+n)。逡逑以图2-2为例,图中两个黑色区域表示已被感染(即己确定为风险对象),逡逑其风险概率为1,其余绿色区域被感染概率则为其中对应数值。其感染概率与传逡逑播的扩散系数有关,以该图为例。每条边对应的是已感染对象传播过程中对其周逡逑边对象感染的概率(即扩散系数),单体被感染的情况比较好理解。逡逑对于交叉感染(图2-2中间部分0.58项对象)的情况分析:对于左侧己感染逡逑对象,它对目标感染概率为0.4,则不感染的概率为1-0.4即0.6,右侧己感染对逡逑8逡逑
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:D917;TP301.6
【参考文献】
相关期刊论文 前9条
1 王珊;王会举;覃雄派;周p
本文编号:2598354
本文链接:https://www.wllwen.com/shekelunwen/gongan/2598354.html