当前位置:主页 > 医学论文 > 医卫管理论文 >

关联规则方法在辅助诊疗中的应用研究

发布时间:2020-05-30 13:54
【摘要】:当前我国的信息社会处在高速发展当中,与之相伴的是大数据的重要性也愈发的显现出来,大数据的地位已经上升到了战略资源的高度。医疗行业是信息量非常高的行业,不计其数的医疗数据每天被生产出来。庞大的医学数据包含许多有价值的信息,这些信息对相关疾病的诊断和治疗以及医学研究的发展具有重要意义。目前,许多大中型医院都建立了医院信息系统(HIS),但HIS系统对数据的使用仅限于简单查询,在对蕴含价值的数据进行数据分析和辅助诊疗等方面显得较为吃力。当今的数据挖掘技术已经日趋成熟,将关联规则数据挖掘技术应用在患者疾病信息的处理当中,从找出较为普遍的某类疾病与危险因素的有用信息,这将给医生对同类疾病的诊断提供较大帮助,具有重要的现实意义。本文从医疗大数据出发,对医疗数据的特点及数据挖掘算法进行了介绍,挑选了适用于医疗场景的关联规则经典算法——Apriori算法进行重点学习。Apriori算法用来挖掘目标对象各属性之间的关系,主要包括两部分的内容,寻找频繁项集和产生强关联规则。针对传统Apriori算法的两点不足,本文提出了相应的改进方法:第一,用一维数组来代替数据库,以此来减少算法频繁扫描数据库的问题。第二,引入预剪枝策略,以此来解决候选项集规模巨大的问题。在改进的算法基础上,设计了乳腺肿瘤疾病关联规则获取的整体方案,找寻有价值的关联规则。使用改进的关联规则算法和传统算法对临床乳腺肿瘤疾病脱敏数据进行挖掘,发现两种方法产生的频繁项集是一致的,证明了算法的正确性。在同样的数据集下,将两种算法进行性能对比,证明了改进算法的效率明显高于传统算法。
【图文】:

伪代码,改进算法,算法流程,整体流


图3-1算法流程阁逡逑算法的伪代码如下所示

离散化,支持度,数据,频繁项集


4.3生成强关联规则逡逑将数据离故化之M川改进兑法进行数裾挖掘,选取不同的支持度会产牛.不同的逡逑频繁项集,经过多次试验之C,发现支持度阈仉设置为0.5较为合忇。阁4-3所示逡逑的足支持度为0.5时,使川改进算法挖掘得到的频繁项集。逡逑由阁4_3可以得到在支持度为0.5时,生成的最大频繁项集为频繁4-项集。M逡逑性a()对应是否复发,域性a4对应受侵淋巴结数,属性a5对应有无结节冒,属性逡逑a9对应是否放疗,丨后的数字代表各属性的取值。逡逑改进算法挖掘得到的频繁4-项集Q嚕扛觯哄义希锤捶ⅲ苜馨徒幔埃玻藿峤诿埃捶帕疲С侄燃剖保矗怠e义贤诰虻玫降钠捣保常罴疩嚕锤觯哄义希锤捶ⅲ芮至馨停埃玻藿峤诿埃С侄燃剖保叮埃诲义希锤捶ⅲ芮至馨停ǎ玻旆帕曝С侄燃剖保矗罚哄义希锤捶ⅲ藿峤诿埃捶帕曝С侄燃剖保担保诲义希藿峤诿埃芮至馨停埃玻捶帕疲С侄燃剖保罚丁e义,

本文编号:2688226

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2688226.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cfb05***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com