Top-K闭高效用模式挖掘方法研究与应用
发布时间:2021-08-07 10:58
随着计算机和互联网技术的迅猛发展,产生了大量的数据,这些数据存在许多有趣的信息,使用数据挖掘技术可以有效的挖掘并分析这些信息,可以完成推荐、预测、分类等任务。在数据挖掘领域中,高效用模式挖掘起着重要的作用,高效用模式是指效用值大于用户指定的最小效用值的所有模式。高效用模式中存储着大量有效的信息,但是仍存在大量冗余模式。研究学者提出的闭高效用模式可以有效减少冗余模式,如果一个模式不存在与自身的支持度相同的超集,且效用值大于最小效用值,那么该模式就是一个闭高效用模式。在实际应用中,高效用模式的挖掘需要多次进行最小效用值尝试,这会产生大量的调试时间,使用Top-K高效用模式可以有效解决该问题,该模式是指用户指定的k个效用值最大的模式。闭高效用模式尽管解决了冗余模式问题,但仍会存在最小效用值调试困难的问题,而Top-K高效用模式中仍存在大量冗余模式,针对这两个问题,首先对紧凑高效用模式进行研究与分析;然后提出Top-K闭高效用模式挖掘算法TKCU-Miner,并基于TKCU-Miner算法提出Top-K闭高效用关联规则挖掘算法;最后设计实并现基于Top-K闭高效用模式挖掘方法的验证平台。主要研...
【文章来源】:北方民族大学宁夏回族自治区
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
高效用模式类型的关系
图 3-2 Construct ()函数流程图模式是否为闭模式。在闭模式判别时,进行“验证前缀项 - 添加后的判别,如果前序的每个项 ip存在的事务 Tidset(ip)都包含当前模idset(i),如果该事务中存在的项,那么由定义 11 可知,Y 被其前集 PrevSet(Y),继续进行 Y 的下一个枢纽 I2项的 k+1 项集判断。反包含 Y 的所存在有事务,说明其不被前序项所闭包,可以继续进(Y)的扩展。意后序项集任意项 iq所存在的事务包含 iq.tid,那么项 iq是 Y 的闭 Y∪iq,并构建其 uList。反之,将其扩展到 Y 的后序项集 PostSe使用。新 Top-K 缓存区。在 Y 扩展完毕之后,使用 uList(Y),得到 Y.sumEU
图 3-3 Top-K save() 函数流程图需要判断是否达到条件的模式。当 PrevSet(X)为空的所有 Y后一项)后,PrevSet(X) = PrevSet(X)∪ X,X 取其后序模式行以上操作,输入为 X,PrevSet(X),PostSet(X),new_top_务数据库完全遍历,获得的 Top-K 缓存区的所有模式,就。使用 2.1 节表 2-2 的事务数据库举出以下几个例子:首先按排序建立好 d、b、c、e、a 五个项的 uList,在最初输序模式 PostSet(X)为 d、b、c、e、a;前序模式 PrevSet(X)为old 为 0。枢纽项为 d,PostSet(X)为 bcea,PrevSet(X)为空,最小。在 uList(d)中,d.sumEU + d.sumRU = 58 + 170 = 228,大于
【参考文献】:
期刊论文
[1]面向购物篮数据的稀有序列模式挖掘算法[J]. 周忠玉,皮德常. 小型微型计算机系统. 2019(03)
[2]面向卫星遥测数据流的最小稀有模式挖掘方法[J]. 周忠玉,皮德常. 计算机学报. 2019(06)
[3]数据流频繁模式挖掘综述[J]. 韩萌,丁剑. 计算机应用. 2019(03)
[4]基于Top-k的高效用模式挖掘算法[J]. 赵林柳,吕鑫,陶飞飞. 计算机工程. 2019(05)
[5]一种频率约束的高效用模式挖掘算法[J]. 张全贵,曹阳,李志强. 计算机应用与软件. 2018(11)
[6]基于特征效用参与率的空间高效用co-location模式挖掘方法[J]. 王晓璇,王丽珍,陈红梅,方圆,杨培忠. 计算机学报. 2019(08)
[7]近端云计算:后云计算时代的机遇与挑战[J]. 周悦芝,张迪. 计算机学报. 2019(04)
[8]一种利用关联规则挖掘的多标记分类算法[J]. 刘军煜,贾修一. 软件学报. 2017(11)
[9]减少候选项集的数据流高效用项集挖掘算法[J]. 茹蓓,贺新征. 计算机应用研究. 2017(11)
[10]一种快速挖掘top-k高效用模式的算法[J]. 吴倩,王林平,罗相洲,崔建群,王海. 计算机应用研究. 2017(11)
硕士论文
[1]基于高效用模式挖掘的微博文本突发话题检测方法研究[D]. 欧阳双.武汉大学 2018
[2]基于效用矩阵和索引的top-k高效用项目集挖掘研究[D]. 王蕊.东北大学 2013
本文编号:3327675
【文章来源】:北方民族大学宁夏回族自治区
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
高效用模式类型的关系
图 3-2 Construct ()函数流程图模式是否为闭模式。在闭模式判别时,进行“验证前缀项 - 添加后的判别,如果前序的每个项 ip存在的事务 Tidset(ip)都包含当前模idset(i),如果该事务中存在的项,那么由定义 11 可知,Y 被其前集 PrevSet(Y),继续进行 Y 的下一个枢纽 I2项的 k+1 项集判断。反包含 Y 的所存在有事务,说明其不被前序项所闭包,可以继续进(Y)的扩展。意后序项集任意项 iq所存在的事务包含 iq.tid,那么项 iq是 Y 的闭 Y∪iq,并构建其 uList。反之,将其扩展到 Y 的后序项集 PostSe使用。新 Top-K 缓存区。在 Y 扩展完毕之后,使用 uList(Y),得到 Y.sumEU
图 3-3 Top-K save() 函数流程图需要判断是否达到条件的模式。当 PrevSet(X)为空的所有 Y后一项)后,PrevSet(X) = PrevSet(X)∪ X,X 取其后序模式行以上操作,输入为 X,PrevSet(X),PostSet(X),new_top_务数据库完全遍历,获得的 Top-K 缓存区的所有模式,就。使用 2.1 节表 2-2 的事务数据库举出以下几个例子:首先按排序建立好 d、b、c、e、a 五个项的 uList,在最初输序模式 PostSet(X)为 d、b、c、e、a;前序模式 PrevSet(X)为old 为 0。枢纽项为 d,PostSet(X)为 bcea,PrevSet(X)为空,最小。在 uList(d)中,d.sumEU + d.sumRU = 58 + 170 = 228,大于
【参考文献】:
期刊论文
[1]面向购物篮数据的稀有序列模式挖掘算法[J]. 周忠玉,皮德常. 小型微型计算机系统. 2019(03)
[2]面向卫星遥测数据流的最小稀有模式挖掘方法[J]. 周忠玉,皮德常. 计算机学报. 2019(06)
[3]数据流频繁模式挖掘综述[J]. 韩萌,丁剑. 计算机应用. 2019(03)
[4]基于Top-k的高效用模式挖掘算法[J]. 赵林柳,吕鑫,陶飞飞. 计算机工程. 2019(05)
[5]一种频率约束的高效用模式挖掘算法[J]. 张全贵,曹阳,李志强. 计算机应用与软件. 2018(11)
[6]基于特征效用参与率的空间高效用co-location模式挖掘方法[J]. 王晓璇,王丽珍,陈红梅,方圆,杨培忠. 计算机学报. 2019(08)
[7]近端云计算:后云计算时代的机遇与挑战[J]. 周悦芝,张迪. 计算机学报. 2019(04)
[8]一种利用关联规则挖掘的多标记分类算法[J]. 刘军煜,贾修一. 软件学报. 2017(11)
[9]减少候选项集的数据流高效用项集挖掘算法[J]. 茹蓓,贺新征. 计算机应用研究. 2017(11)
[10]一种快速挖掘top-k高效用模式的算法[J]. 吴倩,王林平,罗相洲,崔建群,王海. 计算机应用研究. 2017(11)
硕士论文
[1]基于高效用模式挖掘的微博文本突发话题检测方法研究[D]. 欧阳双.武汉大学 2018
[2]基于效用矩阵和索引的top-k高效用项目集挖掘研究[D]. 王蕊.东北大学 2013
本文编号:3327675
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3327675.html