决策树方法在医疗诊断及预测中的应用研究
发布时间:2020-08-02 11:53
【摘要】:随着各种数据采集设备的不断完善和丰富,每天都会产生大量的数据,这种现象在医疗行业也不例外。在医疗行业,每天都会产生大量的病例数据、病人诊断信息数据、医生开具的处方信息数据等等。与此同时,针对数据进行信息挖掘的相关技术也在不断的发展,如何将数据挖掘的相关技术应用到医疗行业中,挖掘出一些新的知识和规则,越来越得到大家广泛的关注。由于心脏病严重的威胁了人类的健康,每年全世界有超过1500多万人死于心脏病,全世界范围内关于心脏病的研究也在不断的进行。在计算机领域里,应用于心脏病预测的系统,当前较为成熟的是心脏病诊断专家系统。专家系统启发性强,能使用来自领域专家所积累的知识和经验,来对相关问题进行逻辑推理和结果判断,同时也较为灵活。但是专家系统缺乏自学习性,系统中的知识补充依赖于领域专家的知识和经验提升。使用决策树算法,可以克服专家系统的一些不足。首先决策树具有很强的自学习性,其模型构建仅依赖于数据。同时,决策树较之其他的机器学习算法,还具有过程可解释性的特点,根据模型可以很方便的归纳出相关规则和知识,这对新知识的挖掘具有很重大的意义。在本课题中,分别使用ID3,C4.5和CART决策树算法,构建了 3个决策树模型。旨在找到,在心脏病病例数据中,具有更高性能和更高预测准确率的模型。同时,由于算法各有优劣,为了不断的提高模型的预测准确度,本文将这三个算法的模型进行了组合,同时引入了模型贡献度的概念,采用将三个模型的预估值进行加权求和并加上修正值,共同组成最终的预测结果。使用测试数据对构建的模型进行测试,其结果也验证了改进是相对有效的。与此同时,根据构建的模型可以挖掘出和心脏病有紧密关联的属性特征,构建出心脏病预测的简易模型,从而辅助医疗从业人员和病患对心脏病进行诊断和预防的工作。
【学位授予单位】:华北电力大学(北京)
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R541;TP311.13
【图文】:
下来后是以csv格式存储的,由于数据屮数据类型不一致,无法直接导入到数据逡逑库中。分析原数据中的数据后,确定了各个值的类型,设计好数据库表后,将数逡逑据导入到数据库中,数据获取流程如图3-1所示。逡逑设计逡逑数据逦导入逡逑N邋CSV邋.邋分析逦数据逡逑T邋载逦匚^>邋数据逡逑^邋文件逦数据逦库表逦y逡逑中心逦库逡逑结构逡逑图3-1原数据获取流程逡逑根据原数据的属性信息,和取值特征,设计的数据库表结构如表3-1所示。逡逑表3-1数据库表结构逡逑 ̄ ̄逦字段名称逦长度逦数据类型逦允许为空逦说明逡逑age逦5逦Float逦YES逦年龄逡逑sex逦__逦2逦Float逦YES逦性别逡逑cp逦5逦Float逦YES逦胸痛类型逡逑trestbps逦5逦Float逦YES逦静息血压逡逑13逡逑
——一邋——邋(N<N<NCNj(NfNj逡逑图3-6静息血压值的分布(单位:mmHg)逡逑从图3-fi中也可以看出原数据中,静息血压属性值的范围在90-200邋(单位:逡逑mmHg)之间,符合医学上的测量范围。逡逑血mü檀己垮义希叮埃板义希板义希蓿铮铮浚铮迹
本文编号:2778475
【学位授予单位】:华北电力大学(北京)
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R541;TP311.13
【图文】:
下来后是以csv格式存储的,由于数据屮数据类型不一致,无法直接导入到数据逡逑库中。分析原数据中的数据后,确定了各个值的类型,设计好数据库表后,将数逡逑据导入到数据库中,数据获取流程如图3-1所示。逡逑设计逡逑数据逦导入逡逑N邋CSV邋.邋分析逦数据逡逑T邋载逦匚^>邋数据逡逑^邋文件逦数据逦库表逦y逡逑中心逦库逡逑结构逡逑图3-1原数据获取流程逡逑根据原数据的属性信息,和取值特征,设计的数据库表结构如表3-1所示。逡逑表3-1数据库表结构逡逑 ̄ ̄逦字段名称逦长度逦数据类型逦允许为空逦说明逡逑age逦5逦Float逦YES逦年龄逡逑sex逦__逦2逦Float逦YES逦性别逡逑cp逦5逦Float逦YES逦胸痛类型逡逑trestbps逦5逦Float逦YES逦静息血压逡逑13逡逑
——一邋——邋(N<N<NCNj(NfNj逡逑图3-6静息血压值的分布(单位:mmHg)逡逑从图3-fi中也可以看出原数据中,静息血压属性值的范围在90-200邋(单位:逡逑mmHg)之间,符合医学上的测量范围。逡逑血mü檀己垮义希叮埃板义希板义希蓿铮铮浚铮迹
本文编号:2778475
本文链接:https://www.wllwen.com/yixuelunwen/xxg/2778475.html
最近更新
教材专著