当前位置:主页 > 医学论文 > 医卫管理论文 >

健康医疗数据隐式关联关系的发现与度量

发布时间:2025-01-15 10:35
  我国国家宏观健康管理策略重点已从疾病诊治转变为健康风险评估与预测。医疗行业信息化过程中已累积丰富的健康医疗数据,在群体层面蕴含着疾病发生与分布规律以及影响健康各种因素的知识,在个体层面为疾病早期预警及个性化医疗提供前所未有的契机。海量健康医疗数据中潜在关联关系的获取是我国健康医疗信息化发展的重要支撑技术。当前数据关联关系挖掘的理论与方法难以满足健康医疗深度应用的需求,突出表现在(1)人群疾病与生命体征间的复杂关联(有语义)难以全面发现;(2)个体内部的复杂动力学相关性(无语义)难以准确度量。具体而言,健康医疗数据隐式关联关系发现面临着两大技术挑战:(1)群体层面的有趣关联规则挖掘。有语义健康医疗数据包含海量的数据项与事务数,蕴含疾病、各种生命体征的重要信息,探寻其中的有趣关联对疾病预防与诊断意义重大。传统数据挖掘方法的理论局限性导致上述复杂关联无法全面反映,同时难以应对健康医疗数据的规模与复杂度。(2)个体层面的复杂系统同步度量。个体健康医疗数据是个体复杂系统演化过程的记录,系统内部各部分的同步关系对个体健康状态异常的理解非常重要。比如大脑信息的传递需要众多神经元群共同协作完成,传统双通...

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

图2-1?Apriori算法过程??

图2-1?Apriori算法过程??

2.1.2?Apr?i?or?i?算法??Apriori算法是第一个基于支持度的剪枝策略,以避免候选项目集呈指数增长??的算法[34]。图2-1描述了使用Apriori算法对上表中超市购物篮分析的部分后续??步骤。假设最小支持计数等于3?(即,支持度=3/5?=?60%)。将最初....


图3-1示例数据集的FP-Tree与HeaderTable??以表3-1中的数据为例,设最小支持度minSup=0.4,则PNFP-Growth算法第??

图3-1示例数据集的FP-Tree与HeaderTable??以表3-1中的数据为例,设最小支持度minSup=0.4,则PNFP-Growth算法第??

完整频繁项目集合为{-e,?b,?e,g,-b,?-m,h,?j,m,?-j}。??第二次遍历数据集时,以T001为例,将其按支持度排序并过滤后为{g,h,e,??-b,j,?m},接着讲T001按此顺序插入到PNFP-Tree中。最终PNFP-Tree如图3-1??所示。最终频....


图3-2不同支持度下的运行时间??26??

图3-2不同支持度下的运行时间??26??

Zl?::零等々黄々?今??::??〒〇申4??4??c:?-m?m??图3-1示例数据集的FP-Tree与HeaderTable??以表3-1中的数据为例,设最小支持度minSup=0.4,则PNFP-Growth算法第??一次遍历数据库可得到正相关的频繁项目集合及频繁数为:{....


图3-3不同最小支持度下平均每秒产生的频繁项目集数量??图3-3给出了不同最小支持度下FP-Growth算法和PNFP-Growth算法平??均每秒产生频繁项目集的数量对比

图3-3不同最小支持度下平均每秒产生的频繁项目集数量??图3-3给出了不同最小支持度下FP-Growth算法和PNFP-Growth算法平??均每秒产生频繁项目集的数量对比

健康医疗数据隐式关联关系发现与度量??不同最小支持度minSup下算法的运行时间对比见图3-2。从图中可看出当??最小支持度大于等于0.5时,FP-Growth算法和PNFP-Growth算法的执行时间非??常接近;而当最小支持度小于0.5时,二者的执行时间随最小支持度的减小,差....



本文编号:4027275

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/4027275.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0deda***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com