基于效用的序列模式挖掘及隐藏方法研究
发布时间:2024-07-10 22:54
序列模式挖掘是数据挖掘中一个经典的研究话题。但是在序列模式挖掘中,用于衡量事物重要程度的支持度有时并不能反映出用户对某一知识的感兴趣程度。例如支持度并不能反映出网页浏览时长,商品利润等这些决策者感兴趣的信息。为了解决这一问题,研究人员在序列模式挖掘的基础上使用效用来衡量模式的重要程度,并由此提出了基于效用的序列模式挖掘,即从数据库中找到所有指定阈值下具有高效用的序列模式。虽然基于效用的序列模式挖掘方法可以找到具有高价值的知识,但是在一定程度上也会带来信息泄露的隐患。针对这一问题,研究人员提出了隐藏方法来避免或减小这一问题造成的危害。与挖掘方法相反,隐藏方法通过对指定数据库进行修改,进而达到隐藏指定阈值下的高效用序列的目的。本文分别从挖掘和隐藏两个角度出发,对现有算法进行了相应的改进。在很多场景中,决策者往往偏向于找出具有高效用值的模式。为此,本文提出利用项与项之间的层次关系来找出具有更高效用值的模式,即层次高效用序列模式挖掘。为了找出这些模式,本文提出了MHUH(Mining high utility hierarchical sequential patterns)算法。引入层次关系...
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
本文编号:4004860
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
图3-1记录了层次关系的三棵分类树
IDq-序列Q1<{(a1,1,1)}{(a2,3)}{(a2,2)(C,2)}{(c1,1,1)}{(c2,4)}>Q2<{(a1,1,2)}{(a2,1)}{(b2,2)}{(b1,4)}>Q3<{(a1....
图3-3使用PBS策略减小分类树规模在上面的例子中,经过PBS策略后,S能够生成的序列的最大个数从107
哈尔滨工业大学工学硕士学位论文24表3-3生成s-序列算法:searchSSequence输入:序列S,开始的下标k,访问标志visited,存储序列的集合G1.ifvisited=falsethen2.ifu(S)<minUtilthen3.return;4.end5.从G中移....
本文编号:4004860
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4004860.html
最近更新
教材专著