当前位置:主页 > 医学论文 > 传染病论文 >

基于神经网络模型的慢乙肝相关疾病患者聚类及医疗费用预测研究

发布时间:2020-03-18 04:37
【摘要】:目的:乙型肝炎病毒(Hepatitis B virus,HBV)感染是全球主要的公共卫生问题之一,不仅严重危害着人类健康,而且给患者造成了沉重的经济负担。合理配置医疗卫生资源,降低患者、家庭和社会经济负担是医疗保障工作解决的重点问题之一。因此,科学精准地预测医疗费用是开展工作的重要前提。基于医院电子病历系统的数据,具有易获得,能反映真实医疗环境等特点,已成为卫生经济学评价过程较为理想的数据来源。但医疗费用分布呈现出“偏峰”“厚尾”的特征,而且影响费用分布的因素较为复杂,这些因素在患者中的分布也呈现出高维度,类型复杂,多重共线等特点,如临床治疗决策包括多种药物的单用及联用,实验室指标种类繁多,且有很强的相关性。因此,采用传统统计分析方法条件受限,且单纯的根据某些可观测的变量进行分组来分析患者的医疗费用,难以完整反映患者群体特征。如若能在有效识别患者群体异质性的基础上进行费用预测,将有可能提高预测准确性。本研究基于SOM神经网络聚类分析,探测患者入院状态、住院治疗方式的群体异质性,同时,建立住院总费用的BP神经网络预测模型分析其影响因素,并与线性回归模型的预测情况作对比,评估SOM与BP神经网络模型在慢乙肝相关疾病住院患者医疗费用预测的可行性。为慢乙肝相关疾病的诊疗、费用控制提供科学合理的数据佐证,并为神经网络方法在临床费用数据的应用提供方法学支持。方法:本研究基于广州市某传染病医院信息系统,纳入分析2014和2015年慢乙肝及其相关疾病患者5194人次(2014年:2522;2016年:2672),描述两年患者的人口学特征、入院时实验室检查结果、住院期间治疗方案及医疗费用情况。并采用无监督的SOM神经网络方法分别对两年住院患者的住院期间治疗方案和入院时实验室检查结果进行聚类分析,探索住院患者的群体异质性。再者,通过与有监督的BP神经网络方法相结合,建立住院总费用的预测模型并分析其影响因素。根据纳入预测变量的不同,建立住院患者总费用的BP神经网络预测模型(NN-cost-1、NN-cost-2、NN-cost-3和NN-cost-4),相应的建立线性回归预测模型(LR-cost-1、LR-cost-2、LR-cost-3和LR-cost-4);同时建立住院患者对数(lg)费用的BP神经网络模型(NN-lgcost-1、NN-lgcost-2、NN-lgcost-3和NN-lgcost-4),相应的建立线性回归模型(LR-lgcost-1、LR-lgcost-2、LR-lgcost-3和LR-lgcost-4)。随后,比较模型间与模型内的预测性能。上述过程均将2014年慢乙肝及其相关疾病住院患者作为训练集,以2015年住院患者为验证集。结果:本研究纳入分析的5194人次慢乙肝及其相关疾病住院患者中,其中以男性为主(78.17%),平均年龄46.0±14.2岁;自费患者占比最高(60.74%),医保患者占35.79%;且以慢乙肝患者为多(40.62%);平均住院15.2±13.0天;有17.50%的患者前一年有过住院记录。2014和2015年慢乙肝及其相关疾病住院患者的次均总费用分别为10837.8和10873.8元。其中,药物费用最高,分别为4510.9和4024.7元,其次为检验检查费,分别为3499.2和3626.9元。SOM聚类探究患者住院治疗方式的异质性显示,患者住院治疗方式主要包括4类,分别为:1.抗病毒联合对症联合并发症治疗模式;2.对症联合并发症治疗模式;3.抗病毒联合保肝治疗模式;4.保肝为主治疗模式。此四种模式患者2014年的次均住院总费用分别为20618.7、13393.3、8743.4和6043.0元,2015年分别为:21096.6、13801.3、9107.7和5626.0元,且各类费用成分的差异有统计学意义。经SOM聚类的患者入院疾病状态有4类,分别为:1.肝功异常伴肝脏合成功能障碍伴高HBV-DNA病毒载量;2.肝功异常伴肝脏合成功能障碍;3.肝功异常伴高HBV-DNA病毒载量;4.肝功异常。此四种入院状态患者2014年均次住院费用分别为:18012.9、14380.1、8194.6和7527.8元,2015年分别为:16810.1、11934.7、8610.1和6093.8元。且在其他费用成分上差异有统计学意义。神经网络模型在预测总费用方面(NN-cost),模型预测准确性在训练集和验证集分别约为83%和77%。将经SOM聚类后形成的用于反映患者入院时检验状态和住院治疗方式的变量作为预测变量(NN-cost-2、NN-cost-3、NN-cost-4),较NN-cost-1提高了预测准确性,同时减少了MAPE。神经网络模型在预测对数总费用方面(NN-lgcost),四个模型的预测性能也呈现出相同的结果。本研究发现,NN-cost模型均优于LR-cost模型,预测准确性提高了约3%,同时减少MAPE,说明本研究中,神经网路模型在预测住院总费用方面优于线性回归模型。同样的,NN-lgcost模型均优于LR-lgcost模型,提示在对数总费用预测上,神经网络也显示较强的优势。本研究还发现,NN-lgcost的四个模型较相应的NN-cost模型均提高了模型的预测准确性(约3%),提示对住院总费用进行对数转换后,提高了模型预测的准确性。同样的,LR-lgcost模型也均优于LR-cost模型,说明将经对数转化后的费用作为预测目标,提高了线性回归模型的预测准确性。此外,分析神经网络模型中预测变量重要性发现,经SOM聚类后形成反映群体异质性的变量作为预测变量,在费用预测中重要程度较高。采用神经网络模型预测医疗费用,有效地避免了线性回归过程中自变量间相关等诸多问题,改善了线性回归过程中自变量的影响作用,而且提高了预测准确性。结论:经SOM神经网络聚类分析探测患者治疗方式及入院状态上的群体异质性发现,异质性患者在住院总费用及费用成分上的差别有统计学意义。说明经SOM聚类能较好的区分患者的群体异质性,为后续住院费用的预测提供前提。采用BP神经网络预测住院总费用的模型优于线性回归模型。基于SOM神经网络聚类分析后,将生成的用于反映患者群体异质性的变量作为预测变量,提高了预测性能。与总费用的预测相比,在预测对数转化后的总费用方面,无论神经网络模型还是线性回归模型,预测性能均显著提高。
【图文】:

流程图,研究对象,流程图,阴性


发症治疗、抗纤维化、调节免疫、退黄和活血化瘀、其他治疗的药费,信息均按每年 5%贴现率至 2015 年。表 2.1 患者入院时实验室生化检查指标分类说明说明1:<40U/L(正常),2:40-80U/L,3:≥80U/L1:<50U/L(正常),2:50-100U/L,3:≥100U/L1:<22.2μmol/L(正常),2:22.2-44.4μmol/L,,3:≥44.4μmol/L1:<75%(异常),2:75-100%(正常)1:正常(35.0-55.0g/L),2:异常(>55.0g/L 或<35.0g/L)1:正常(1.5-2.5),2:异常(>2.5 或<1.5)NA1:<1000cps/ml(正常),2:[1000,10000)cps/ml,3:[10000,100000)cps/ml,≥100000cps/mlg 1:阴性(<1.00COI),2:阳性(≥1.00COI)b 1:阴性(>1.00COI),2:阳性(≤1.00COI)1:阴性(0-50ug/L),2:阳性(>50ug/L)

输入层,输出层,神经元,维度


图 2.2 SOM 网络的拓扑结构 网络聚类的学习算法具体步骤[38]:样本含量为 p,每个输入样本包含 m 个变量的资料,基本 S下:层含有 m 个神经元,即输入样本向量的维度为 m,输出层输入层和输出层各神经元的权向量连接数目为 m×n 个。 ,…,xmT表示,wijt 表示迭代次数为 t 次时从输入层神经元权重系数向量。计合理的网络结构。初始化 t = 0,赋予wij0 一个较小的随的随机数,围绕输出层神经元 j 建立半径为Nj0 的初始邻数 T(T>m)和目标误差。一个样本进入输入层,按公式(1.1)计算输入向量 X = x1,x2经元之间的欧氏距离和dj,其中xi为样本第 i 维度的分量。
【学位授予单位】:广东药科大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R512.62

【参考文献】

相关期刊论文 前10条

1 张维璐;吉兆华;付婷;张磊;苏海霞;闫永平;;中国2007-2016年59岁以下普通人群HBsAg阳性率的Meta分析[J];中华流行病学杂志;2017年09期

2 马起山;梁森;肖和卫;张顺祥;庄贵华;邹宇华;谭红专;刘近春;张毓洪;徐爱强;张丽;冯向先;胡东生;王富珍;崔富强;梁晓峰;;中国12个地区乙型肝炎相关疾病住院患者经济负担调查[J];中华流行病学杂志;2017年07期

3 王贵强;王福生;成军;任红;庄辉;孙剑;李兰娟;李杰;孟庆华;赵景民;段钟平;侯金林;贾继东;唐红;盛吉芳;彭R

本文编号:2588223


资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/chuanranbingxuelunwen/2588223.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户66415***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com