当前位置:主页 > 经济论文 > 保险论文 >

医疗保险欺诈检测的研究与应用

发布时间:2017-08-26 09:12

  本文关键词:医疗保险欺诈检测的研究与应用


  更多相关文章: 医疗保险 欺诈检测 二级特征提取 高斯混合模型 随机森林算法


【摘要】:随着国内基本医疗制度的改革,医疗保险覆盖面越来越广,引发了越来越严重的医疗保险欺诈行为,严重影响了人们的看病就医。因此,建立完善的医疗保险欺诈检测系统,预防欺诈行为显得尤为重要。本文主要工作是通过研究医疗保险数据,提取合适的特征,采用无监督聚类和有监督分类相结合的方法,建立了一套医疗保险欺诈检测模型。本文首先通过分析医疗保险数据规律,结合使用统计分析技术,对数据进行二级特征提取;一方面是根据医药使用知识和概率统计方法,提取了常用药关联性和诊疗方案合理性的二级特征;另一方面根据医药专业知识、高斯混合模型技术和学习积分知识提取了大类医药偏离度的二级特征。根据已有的医疗保险欺诈审核规则对数据集进行正常与欺诈的划分,并提出对医疗保险数据中存在的正常行为数据进行聚类建模,通过聚类算法,将数据中的正常行为数据聚出特定的类别,然后为每个正常行为数据聚类簇和欺诈数据分别建立一个分类模型。本文在提取新特征的基础上,对正常数据用高斯混合模型进行聚类分析,得到不同的聚类簇后,采用数据挖掘中的随机森林和支持向量机分类算法将每个聚类簇与欺诈数据建立分类模型。建立模型后对新数据首先是特征提取,然后与聚类模型进行距离度量,选取距离最近的聚类簇所构建的分类模型,将新数据用选取的分类模型进行欺诈识别。本文使用医疗保险管理局的医疗保险数据,对建立的欺诈检测模型进行验证,实验结果表明欺诈检测模型具有很好的欺诈识别效果,证明本文提出的医疗保险欺诈检测模型在实际应用中有良好的性能。
【关键词】:医疗保险 欺诈检测 二级特征提取 高斯混合模型 随机森林算法
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;F842.684;R197.1
【目录】:
  • 摘要5-6
  • ABSTRACT6-9
  • 第一章 绪论9-15
  • 1.1 选题背景与研究意义9-10
  • 1.2 研究现状与挑战10-12
  • 1.2.1 国内外研究现状10-12
  • 1.2.2 面临的问题与挑战12
  • 1.3 本文研究内容与创新点12-13
  • 1.4 本文组织结构13-15
  • 第二章 相关理论知识与技术介绍15-30
  • 2.1 数据挖掘概述15-17
  • 2.2 有监督分类算法17-22
  • 2.2.1 决策树算法17-20
  • 2.2.2 支持向量机算法20-22
  • 2.3 无监督聚类算法22-27
  • 2.3.1 k-means聚类算法23-25
  • 2.3.2 高斯混合模型聚类算法25-27
  • 2.4 异常检测算法27-29
  • 2.5 本章小结29-30
  • 第三章 医疗保险数据特征提取30-41
  • 3.1 医疗保险数据30-31
  • 3.2 原始数据预处理31-33
  • 3.3 医疗保险数据二级特征提取33-40
  • 3.3.1 基于统计概率方法的二级特征提取34-37
  • 3.3.2 基于高斯混合模型的二级特征提取37-40
  • 3.4 本章小结40-41
  • 第四章 医疗保险欺诈检测算法41-52
  • 4.1 算法思想41-42
  • 4.2 算法框架42-45
  • 4.3 正常医疗保险聚类建模45-47
  • 4.3.1 确定要聚类的簇数目。45-46
  • 4.3.2 利用高斯混合模型进行聚类46-47
  • 4.4 欺诈判断模型构建47-51
  • 4.4.1 随机森林分类模型构建48-49
  • 4.4.2 支持向量机分类模型构建。49-51
  • 4.5 本章小结51-52
  • 第五章 实验结果与分析52-69
  • 5.1 数据来源及预处理52-55
  • 5.2 特征提取实验55-59
  • 5.2.1 一级特征向量化55
  • 5.2.2 二级特征提取实验55-59
  • 5.3 欺诈检测实验59-68
  • 5.3.1 聚类实验结果及分析59-60
  • 5.3.2 欺诈识别结果及分析60-68
  • 5.4 本章小结68-69
  • 第六章 总结与展望69-71
  • 6.1 总结69
  • 6.2 展望69-71
  • 致谢71-72
  • 参考文献72-75

【参考文献】

中国期刊全文数据库 前2条

1 刘红岩,陈剑,陈国青;数据挖掘中的数据分类算法综述[J];清华大学学报(自然科学版);2002年06期

2 唐华松,姚耀文;数据挖掘中决策树算法的探讨[J];计算机应用研究;2001年08期

中国博士学位论文全文数据库 前1条

1 张莹;我国社会医疗保险中的道德风险表现及治理[D];山东大学;2011年



本文编号:740802

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/bxjjlw/740802.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d1919***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com