数据挖掘技术在医保欺诈检测识别中的应用研究
发布时间:2024-05-30 01:29
随着医疗改革的不断深入,医疗保险的覆盖面不断扩大,医疗保险参保人数也正在迅速增加,与此同时,医保欺诈违规行为也在日益增多,其形式和手段也不断的在翻新,对医疗保险基金的安全稳定发展造成了极大的影响,社会危害极大。由于医保数据具有海量性、多样性、生成快速等大数据的特征,因此传统方法检测识别欺诈的工作量大、效率低下,而且容易出现差错。如何利用这些海量的数据,能够自动高效地检测识别出这些骗保或欺诈行为,是具有重要现实意义的。本文运用数据挖掘技术处理海量医保记录数据,实现医保欺诈检测识别,主要有以下几个方面工作:(1)针对单张处方药费过高等记录具有孤立点分布的特征且医保欺诈行为不存在模仿性和学习性,本文提出了一种基于指标权重的欧氏距离来刻画数据之间相似度的方法。考虑到现有的相关工作多采用基于统计思想或神经网络等有监督学习的分析方法,这种方式通常是需要人工进行欺诈数据标注,但实际上医保记录数据具备大数据的相关特征,数据量大且不具备先验知识,所以本文先对处理后的数据进行主成分分析,计算主成分旋转矩阵与累计方差贡献率得到各个主成分的权重值,通过定义一个衡量指标权重的因子,进而得到每个原始指标的权重值,...
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
本文编号:3984375
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
图2-2各种聚类方法的代表算法
得医疗保障的机会。因此,有必要完善医疗保险信息系统,逐步实现对医疗服务行为的全程实时监控,加强对重点医疗服务项目和重点药品使用情况的监测,减少不合理医疗费用的发生,防范医疗欺诈行为。2.3聚类算法聚类分析(Clusteranalysis)[48]是对于统计数据进行分析的技术,....
图2-3线性可分情况下的支持向量机支持向量机模型基于结构风险最小化原则,通过计算最优超平面(Optimal
图2-3线性可分情况下的支持向量机机模型基于结构风险最小化原则,通过计算最优超erplane,OSH)[52]来进行分类的统计方法,最优超平持向量机模型的推广能力越强。最早的支持向量类面发展而来的,这里我们假设线性可分样本数据本数据中的第i个个案,di为对应的期望输出值....
图2-4遗传算法流程图
图2-4遗传算法流程图在解决有关优化问题时学习上述鸟群寻找食物的行为,需要将行为进行抽象的映射。具体如下:我们将优化问题的解空间比,将其设为d维。还将在解空间中随机产生一组粒子用来类比1,xi2,…,xid]来表示第i个粒子在解空间中的位置。用Vi=[vi1,....
图3-1各表联结
图3-1各表联结清洗按照一定的规则对数据进行处理的过程,为发提供有力保障。数据清洗过程主要包括数据一效值的处理等。医保系统数据库中的数据从多不了有的数据是错误数据、数据之间有冲突,。通常我们需要对获取的数据进行缺失值、重复发现综合表中有一些字段如VIP标志PAP栏目为空....
本文编号:3984375
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/3984375.html