医疗报销异常行为挖掘研究及应用
发布时间:2021-02-21 06:34
随着我国医疗行业信息化的不断深入,医疗数据已呈现爆炸增长的趋势,从海量医疗数据中挖掘出有用的信息受到越来越多学术界研究人员的关注,特别是隐蔽性高、危害大的医疗欺诈行为挖掘。然而现有的异常检测技术在面对高维、不平衡、含有混合数据的数据集时因考虑片面往往性能欠佳,因此一种高准确率高效率的异常检测方法对医保行业具有重大意义。本文综合考虑了某地医疗报销数据集的特点,将医疗欺诈与数据挖掘相结合,提出了一种两段式的混合算法模型MAVF-CIForest,并设计与实现了基于Spark的医疗报销异常行为检测系统。主要工作有以下几个方面:(1)针对数据集中高维度和不平衡的特点,提出了一种基于重采样的集成特征子空间选择方法,较大地提升了对正类样本有利的特征选取概率,同时采用基于分层采样的特征选取,保证了集成模型的多样性。实验表明,本文采用的特征子空间选择方法在面对高维、不平衡的医疗报销数据集下效果优秀,并且使后续算法模型相较未进行特征选择准确率提升了90%。(2)针对数据集中出现的混合数据,提出了一种两段式的集成算法模型MAVFCIForest。其中MAVF处理分类数据,处理后的结果连同连续数据一起作为C...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:90 页
【学位级别】:硕士
【部分图文】:
二维空间内异常点示意图
样本集中正常点和异常点比例图
图 5-11 数据样例图如图 5-11 所示,数据表中即包含分类数据也包含混合数据,符合本文提出的算法模型。图中只展示了部分数据和部分字段,在完整的数据集中,还包含了病人的编号、出院诊断、病人年龄、医疗费用总额和自付比例等对医保异常检测十分重
【参考文献】:
期刊论文
[1]基于高斯过程模型的异常检测算法[J]. 于冰洁,夏战国,王久龙. 计算机工程与设计. 2016(04)
[2]医疗大数据研究现状及其临床应用[J]. 罗旭,刘友江. 医学信息学杂志. 2015(05)
[3]医疗保险骗保特征分析[J]. 李亚子,尤斌. 中国社会保障. 2015(02)
[4]医疗大数据及其面临的机遇与挑战[J]. 张振,周毅,杜守洪,罗雪琼,梅甜. 医学信息学杂志. 2014(06)
[5]医保欺诈的成因及其监管探析[J]. 王蔚臆. 管理观察. 2014(08)
[6]国内外医疗保险欺诈研究现状分析[J]. 林源. 保险研究. 2010(12)
[7]Bagging中文文本分类器的改进方法研究[J]. 张翔,周明全,耿国华. 小型微型计算机系统. 2010(02)
[8]异常检测综述[J]. 陈斌,陈松灿,潘志松,李斌. 山东大学学报(工学版). 2009(06)
[9]医疗保险中的欺诈与反欺诈问题[J]. 夏宏,汪凯,张守春. 现代预防医学. 2007(20)
硕士论文
[1]基于统计方法的异常数据检测及其修复[D]. 金伟.南京邮电大学 2016
[2]医疗保险欺诈检测问题研究[D]. 张海洋.山东大学 2016
[3]基于离群点检测的新农合医保欺诈识别的研究[D]. 高宇彤.哈尔滨商业大学 2015
[4]医疗保险数据异常行为检测算法和系统[D]. 楼磊磊.浙江大学 2015
[5]基于BP神经网络的健康保险欺诈识别研究[D]. 杨超.青岛大学 2014
[6]中国医疗保险制度改革研究[D]. 崔婷博.东北师范大学 2013
[7]基于核方法的异常检测技术的研究[D]. 张思懿.江南大学 2012
[8]数据挖掘技术在医保领域中的研究与应用[D]. 何俊华.复旦大学 2011
[9]城镇职工基本医疗保险异地就医道德风险控制[D]. 陈琼.复旦大学 2010
[10]商业医疗保险中的道德风险控制研究[D]. 黄鎏.湖南大学 2006
本文编号:3043982
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:90 页
【学位级别】:硕士
【部分图文】:
二维空间内异常点示意图
样本集中正常点和异常点比例图
图 5-11 数据样例图如图 5-11 所示,数据表中即包含分类数据也包含混合数据,符合本文提出的算法模型。图中只展示了部分数据和部分字段,在完整的数据集中,还包含了病人的编号、出院诊断、病人年龄、医疗费用总额和自付比例等对医保异常检测十分重
【参考文献】:
期刊论文
[1]基于高斯过程模型的异常检测算法[J]. 于冰洁,夏战国,王久龙. 计算机工程与设计. 2016(04)
[2]医疗大数据研究现状及其临床应用[J]. 罗旭,刘友江. 医学信息学杂志. 2015(05)
[3]医疗保险骗保特征分析[J]. 李亚子,尤斌. 中国社会保障. 2015(02)
[4]医疗大数据及其面临的机遇与挑战[J]. 张振,周毅,杜守洪,罗雪琼,梅甜. 医学信息学杂志. 2014(06)
[5]医保欺诈的成因及其监管探析[J]. 王蔚臆. 管理观察. 2014(08)
[6]国内外医疗保险欺诈研究现状分析[J]. 林源. 保险研究. 2010(12)
[7]Bagging中文文本分类器的改进方法研究[J]. 张翔,周明全,耿国华. 小型微型计算机系统. 2010(02)
[8]异常检测综述[J]. 陈斌,陈松灿,潘志松,李斌. 山东大学学报(工学版). 2009(06)
[9]医疗保险中的欺诈与反欺诈问题[J]. 夏宏,汪凯,张守春. 现代预防医学. 2007(20)
硕士论文
[1]基于统计方法的异常数据检测及其修复[D]. 金伟.南京邮电大学 2016
[2]医疗保险欺诈检测问题研究[D]. 张海洋.山东大学 2016
[3]基于离群点检测的新农合医保欺诈识别的研究[D]. 高宇彤.哈尔滨商业大学 2015
[4]医疗保险数据异常行为检测算法和系统[D]. 楼磊磊.浙江大学 2015
[5]基于BP神经网络的健康保险欺诈识别研究[D]. 杨超.青岛大学 2014
[6]中国医疗保险制度改革研究[D]. 崔婷博.东北师范大学 2013
[7]基于核方法的异常检测技术的研究[D]. 张思懿.江南大学 2012
[8]数据挖掘技术在医保领域中的研究与应用[D]. 何俊华.复旦大学 2011
[9]城镇职工基本医疗保险异地就医道德风险控制[D]. 陈琼.复旦大学 2010
[10]商业医疗保险中的道德风险控制研究[D]. 黄鎏.湖南大学 2006
本文编号:3043982
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/3043982.html