健康医疗数据隐式关联关系的发现与度量
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图2-1?Apriori算法过程??
2.1.2?Apr?i?or?i?算法??Apriori算法是第一个基于支持度的剪枝策略,以避免候选项目集呈指数增长??的算法[34]。图2-1描述了使用Apriori算法对上表中超市购物篮分析的部分后续??步骤。假设最小支持计数等于3?(即,支持度=3/5?=?60%)。将最初....
图3-1示例数据集的FP-Tree与HeaderTable??以表3-1中的数据为例,设最小支持度minSup=0.4,则PNFP-Growth算法第??
完整频繁项目集合为{-e,?b,?e,g,-b,?-m,h,?j,m,?-j}。??第二次遍历数据集时,以T001为例,将其按支持度排序并过滤后为{g,h,e,??-b,j,?m},接着讲T001按此顺序插入到PNFP-Tree中。最终PNFP-Tree如图3-1??所示。最终频....
图3-2不同支持度下的运行时间??26??
Zl?::零等々黄々?今??::??〒〇申4??4??c:?-m?m??图3-1示例数据集的FP-Tree与HeaderTable??以表3-1中的数据为例,设最小支持度minSup=0.4,则PNFP-Growth算法第??一次遍历数据库可得到正相关的频繁项目集合及频繁数为:{....
图3-3不同最小支持度下平均每秒产生的频繁项目集数量??图3-3给出了不同最小支持度下FP-Growth算法和PNFP-Growth算法平??均每秒产生频繁项目集的数量对比
健康医疗数据隐式关联关系发现与度量??不同最小支持度minSup下算法的运行时间对比见图3-2。从图中可看出当??最小支持度大于等于0.5时,FP-Growth算法和PNFP-Growth算法的执行时间非??常接近;而当最小支持度小于0.5时,二者的执行时间随最小支持度的减小,差....
本文编号:4027275
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/4027275.html