基于效用的序列模式挖掘及隐藏方法研究

发布时间:2024-07-10 22:54
  序列模式挖掘是数据挖掘中一个经典的研究话题。但是在序列模式挖掘中,用于衡量事物重要程度的支持度有时并不能反映出用户对某一知识的感兴趣程度。例如支持度并不能反映出网页浏览时长,商品利润等这些决策者感兴趣的信息。为了解决这一问题,研究人员在序列模式挖掘的基础上使用效用来衡量模式的重要程度,并由此提出了基于效用的序列模式挖掘,即从数据库中找到所有指定阈值下具有高效用的序列模式。虽然基于效用的序列模式挖掘方法可以找到具有高价值的知识,但是在一定程度上也会带来信息泄露的隐患。针对这一问题,研究人员提出了隐藏方法来避免或减小这一问题造成的危害。与挖掘方法相反,隐藏方法通过对指定数据库进行修改,进而达到隐藏指定阈值下的高效用序列的目的。本文分别从挖掘和隐藏两个角度出发,对现有算法进行了相应的改进。在很多场景中,决策者往往偏向于找出具有高效用值的模式。为此,本文提出利用项与项之间的层次关系来找出具有更高效用值的模式,即层次高效用序列模式挖掘。为了找出这些模式,本文提出了MHUH(Mining high utility hierarchical sequential patterns)算法。引入层次关系...

【文章页数】:67 页

【学位级别】:硕士

【部分图文】:

图3-1记录了层次关系的三棵分类树

图3-1记录了层次关系的三棵分类树

IDq-序列Q1<{(a1,1,1)}{(a2,3)}{(a2,2)(C,2)}{(c1,1,1)}{(c2,4)}>Q2<{(a1,1,2)}{(a2,1)}{(b2,2)}{(b1,4)}>Q3<{(a1....


图3-3使用PBS策略减小分类树规模在上面的例子中,经过PBS策略后,S能够生成的序列的最大个数从107

图3-3使用PBS策略减小分类树规模在上面的例子中,经过PBS策略后,S能够生成的序列的最大个数从107

哈尔滨工业大学工学硕士学位论文24表3-3生成s-序列算法:searchSSequence输入:序列S,开始的下标k,访问标志visited,存储序列的集合G1.ifvisited=falsethen2.ifu(S)<minUtilthen3.return;4.end5.从G中移....



本文编号:4004860

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4004860.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户76d02***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com