关联规则在医保数据分析中的应用
发布时间:2021-03-18 15:13
现代医保数据管理系统已经逐渐成为综合医疗体系系统的重要组成部分,医保数据管理系统已经得到广泛的应用,每天都有包含海量信息的医保数据产生,针对此类数据开展高效的分析活动,进一步获得存在较高价值的决策信息,能够对医师常见病诊疗和医疗合理用药规范的制订起重要作用。但由于其数据存在噪音、不完整、冗余等问题,若不对其有效处理,难以直接用于分析。同时,目前仅用正关联规则对其进行分析的方法也存在一些不足,不能为决策者提供更为全面的信息。因此,本文首先提出了一种改进的基于多支持度的关联规则挖掘算法MMSFP和一种改进的基于两级多支持度的正负关联规则挖掘算法2LFPinFSFS,然后在对某医院的医保数据进行处理的前提下,用改进的2LFPinFSFS算法对心脑血管疾病数据、糖尿病数据和类风湿性关节炎数据进行了分析,得到了一些用药之间与疾病之间的正负关联规则并对其进行了分析,结果对医师常见病诊疗和医疗合理用药规范有重要的参考价值。具体如下:1.提出了一种改进的基于多支持度的关联规则挖掘算法——MMSFP本文提出了一种新的基于多支持度的关联规则挖掘算法MMSFP,考虑了每个事务发生的概率和频率不同的现实问题,对数据集中的每一项设置不同的支持度,即采用多支持度模型——MMS模型,解决了频繁项集冗余的问题,且使用了FP-Growth算法来实现,所以该改进算法的运行速度比MSapriori快了几十倍,而且可以发现更有价值的频繁项集,为关联规则分析提供更好的支持。2.提出了一种改进的基于两级多支持度的正负关联规则挖掘算法——2LFPinFSFS为了挖掘非频繁项集提出了2LS模型,但该模型依然是对整个项集设置两级的单一支持度,忽略了项集中每个事务发生的不同概率和频率问题,而这依然要靠多支持度模型来实现,因此,我们将2LS模型和XMMS模型进行整合,即对项集中的每一项设置两级多支持度,提出了一种新的基于两级多支持度的正负关联规则挖掘算法2LFPinFSFS,使用FP-Growth算法实现,同时挖掘频繁和非频繁项集,实验结果表明该算法更高效,然后通过PNARC模型同时得到正负关联规则。3.关联规则在三种疾病数据分析中的应用针对医保数据有噪音、不完整和冗余等特点,本文做了大量数据预处理工作:对数据中的部分空缺值采取忽略元素、人工填写和删除的方式,对数据中的部分信息进行了语义一致化操作,对数据中的多个离散数据进行了规约处理,最后选取了当今社会比较受重视的三种疾病:心脑血管疾病、糖尿病和类风湿性关节炎的数据进行了正负关联规则的挖掘和分析,比如心脑血管疾病中:地西伴和硫酸阿托品的搭配,查阅资料得知地西伴溶于硫酸阿托品会出现沉淀现象,所以这种联合用药搭配是不合理的,不符合医学规定;而卡托普利与地高辛,卡托普利会增加洋地黄类的中毒发生率,不能联合用药,符合医学规定和常识。类似的,我们在糖尿病和类风湿性关节炎的用药中也得出了很多具有研究价值的规则,结果对合理诊疗的判断有重要参考价值。
【学位单位】:齐鲁工业大学山东省
【学位级别】:硕士
【学位年份】:2017
【文章页数】:71
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 本文研究内容以及创新点
1.3.1 本文结构
1.3.2 本文创新点
第2章 正负关联规则概述
2.1 正关联规则概述
2.1.1 基本概念
2.1.2 经典算法
2.2 负关联规则概述
2.2.1 基本概念
2.2.2 主要算法
2.3 本章小结
第3章 一种改进的多支持度关联规则挖掘算法——MMSFP
3.1 多支持度的关联规则挖掘算法
3.1.1 MSapriori算法
3.1.2 MSBapriori算法
3.2 MMSFP算法
3.3 MMSFP与MSBapriori算法比较
3.3.1 数据说明
3.3.2 实验结果对比
3.4 本章小结
第4章 一种改进的两级多支持度关联规则挖掘算法—2LFPinFSFS
4.1 两级多支持度的关联规则挖掘算法
4.2 2LFPinFSFS算法
4.3 2LFPinFSFS与MMSFP算法比较
4.3.1 数据说明
4.3.2 实验结果
4.4 本章小结
第5章 医保数据处理
5.1 医保数据
5.1.1 医保数据定义
5.1.2 医保数据的研究价值和现状
5.1.3 医保数据特点
5.2 数据处理
5.2.1 数据集选取
5.2.2 数据清理
5.2.3 数据范化
5.2.4 数据规约
5.3 本章小结
第6章 2LFPinFSFS算法在医保数据分析中的应用
6.1 医保数据分析系统的实现
6.2 在心脑血管疾病分析中的应用
6.2.1 心脑血管疾病现状
6.2.2 数据选取
6.2.3 挖掘结果与分析
6.2.4 小结
6.3 在糖尿病分析中的应用
6.3.1 糖尿病现状
6.3.2 数据选取
6.3.3 挖掘结果与分析
6.3.4 小结
6.4 在类风湿性关节炎中的应用
6.4.1 类风湿性关节炎的研究现状
6.4.2 数据选取
6.4.3 挖掘结果与分析
6.4.4 小结
6.5 本章小结
第7章 总结与期望
7.1 总结
7.2 研究展望
参考文献
致谢
在学期间主要科研成果
一、发表学术论文
二、获奖情况
参考文献
期刊论文
[1]基于堆排序的重要关联规则挖掘算法研究[J]. 张永梅,许静,郭莎. 计算机技术与发展. 2016(12)
[2]2型糖尿病周围神经病变机制研究进展[J]. 杨秀颖,张莉,陈熙,杜冠华. 中国药理学通报. 2016(05)
[3]类风湿性关节炎患者高凝血状态与核因子κB活化及致炎因子增加有关[J]. 章平衡,刘健,谈冰,朱福兵,方利. 细胞与分子免疫学杂志. 2016(03)
[4]炎症与异常免疫反应对类风湿性关节炎患者血浆致动脉粥样硬化指数的影响[J]. 霍继炜. 中国医药导报. 2016(01)
[5]医保数据应用的可及性分析[J]. 徐菲,刘国恩. 中国医疗保险. 2015(07)
[6]脂蛋白相关磷脂酶A2和同型半胱氨酸水平与动脉粥样硬化性心脑血管疾病关系的研究[J]. 程清. 检验医学. 2015(01)
[7]基于GPU的并行化Apriori算法的设计与实现[J]. 唐家维,王晓峰. 计算机科学. 2014(10)
[8]基于知识点的多支持度挖掘算法[J]. 杨鹤标,刘桂兰. 计算机应用与软件. 2014(07)
[9]基于数据挖掘技术的门诊合理用药分析[J]. 韩蓉,吴俊. 中国医疗设备. 2014(04)
[10]数据挖掘在我国医保方面应用综述[J]. 冯丽芸. 电脑知识与技术. 2014(05)
硕士论文
[1]基于多支持度的负频繁模式挖掘关键技术研究[D]. 徐田田.齐鲁工业大学 2015
[2]超声评分法和超声造影在类风湿关节炎的应用研究[D]. 蔡晓菡.福建医科大学 2015
[3]数据挖掘在广西城镇居民大病保险试点中的分析和应用[D]. 陈燕萍.广西医科大学 2015
[4]糖尿病中医临床数据预处理及关联规则应用的研究[D]. 吕振红.昆明理工大学 2014
[5]FP-growth算法改进及其在连锁快餐业关联菜品挖掘中的应用[D]. 杨海燕.合肥工业大学 2013
[6]关联规则在高校图书馆读者数据处理中的应用研究[D]. 况莉莉.合肥工业大学 2010
[7]加权负关联规则挖掘技术的研究[D]. 赵园园.山东轻工业学院 2009
[8]数据挖掘技术在医院医保费用分析中的研究与应用[D]. 黄晶晶.南方医科大学 2009
[9]基于多支持度的正负关联规则挖掘技术的研究[D]. 李刚.山东轻工业学院 2008
[10]关联规则挖掘在病案数据分析中的应用研究[D]. 廖海波.合肥工业大学 2008
本文编号:2068077
本文链接:https://www.wllwen.com/shekelunwen/shehuibaozhanglunwen/2068077.html