当前位置:主页 > 科技论文 > 软件论文 >

动态数据库中增量Top-k高效用模式挖掘算法

发布时间:2018-01-31 05:26

  本文关键词: 增量挖掘 效用挖掘 Top-k模式挖掘 动态数据库 出处:《计算机应用研究》2017年05期  论文类型:期刊论文


【摘要】:高效用模式的挖掘需要设定一个合适的阈值,而阈值设定对用户来说并非易事,阈值过小导致产生大量低效用模式,阈值过大可能导致无高效用模式生成。因而Top-k高效用模式挖掘方法被提出,k指效用值前k大的模式。并且大量的高效用挖掘研究仅针对静态数据库,但在实际应用中常常会遇到新事务的加入的情况。针对以上问题,提出了增量的Top-k高效用挖掘算法TOPK-HUP-INS。算法通过四个有效的策略,在增量数据的情况下,有效地挖掘用户所需数量的高效用模式。通过在不同数据集上的对比实验表明TOPK-HUP-INS算法在时空性能上表现优异。
[Abstract]:High utility pattern mining needs to set a suitable threshold, and threshold setting is not easy for users, too small threshold results in a large number of inefficient patterns. Excessive threshold may lead to no high utility pattern generation. Therefore, Top-k high utility pattern mining method is proposed, and a large number of research on high utility mining is only aimed at static database. But in the practical application will often encounter the situation of new transactions to join. In view of the above problems. An incremental Top-k high utility mining algorithm, TOPK-HUP-INS. is proposed. The algorithm uses four effective strategies in the case of incremental data. The comparison experiments on different data sets show that the TOPK-HUP-INS algorithm performs well in time and space performance.
【作者单位】: 华中师范大学计算机学院;
【基金】:国家自然科学基金资助项目(61370108)
【分类号】:TP311.13
【正文快照】: 0引言关联规则挖掘[1~4]是事务数据库中揭示项与项之间关系的基本方法,其中比较典型的是Apriori[5]和FP-Growth[6]算法。但关联规则挖掘仅仅关注于模式(项集)在事务数据库中的频繁度问题,而忽略了模式本身所具有的价值,而该价值往往是用户决策的重要凭据。例如,在超市购物篮模

【相似文献】

相关期刊论文 前10条

1 王宇新;田佳;郭禾;吴树朋;杨元生;;应用模糊方法的设计模式挖掘策略研究[J];计算机工程与应用;2010年02期

2 陆亿红;王子仁;黄燕;;适合稀少空间特征的同位模式挖掘算法[J];浙江工业大学学报;2007年04期

3 郭燕萍;辛伯宇;;高选票例外模式挖掘研究与实现[J];电脑开发与应用;2007年08期

4 徐显九;杨燕;岳爱萍;;高效的用户移动模式挖掘方法[J];计算机应用研究;2007年09期

5 李帆;夏士雄;张磊;;基于模糊理论的不确定轨迹模式挖掘[J];微电子学与计算机;2011年08期

6 李中元;边馥苓;;空间同位模式挖掘研究进展[J];地理空间信息;2013年06期

7 邢东山,沈钧毅,宋擒豹;用户浏览偏爱模式挖掘算法的研究[J];西安交通大学学报;2002年04期

8 刘洪辉;吴岳芬;;用户行为模式挖掘问题的研究[J];计算机技术与发展;2006年05期

9 付晓翠;许盈;车路;;游戏访问模式挖掘的研究与应用[J];郑州大学学报(理学版);2007年04期

10 颜一鸣;郭鑫;李仁发;;一种非确定树模式挖掘算法[J];计算机工程与应用;2011年15期

相关会议论文 前9条

1 王肃;杜军平;高田;;基于本体与知识背景的模式挖掘框架研究[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年

2 缪裕青;尹东;;分布式存储结构的频繁闭合模式挖掘并行算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年

3 王淼;尚学群;谢华博;李战怀;;行常量差异共表达基因模式挖掘算法研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

4 刘玉葆;蔡嘉荣;印鉴;黄志兰;;基于最大访问模式挖掘的数据库异常行为检测[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

5 陆叶;王丽珍;陈红梅;赵丽红;;基于可能世界的不确定空间co-location模式挖掘研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

6 王丽珍;陆叶;陈红梅;肖清;;基于前缀树结构的空间co-location模式挖掘算法研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

7 胡伟成;曹三省;李丹;;一种基于QPop增量时域分割升维的媒体内容应用模式挖掘改进算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

8 薛丹;李德敏;裴仁林;;移动计算中基于PrefixSpan算法的用户移动模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

9 夏庆;马元元;孙志挥;;路径遍历模式挖掘方法的改进[A];第十六届全国数据库学术会议论文集[C];1999年

相关博士学位论文 前7条

1 Shafqat Ali Shad;移动用户轨迹与行为模式挖掘方法研究[D];中国科学技术大学;2013年

2 钱烽;同位模式挖掘研究[D];浙江大学;2012年

3 刘勇;图模式挖掘技术的研究[D];哈尔滨工业大学;2010年

4 覃桂敏;复杂网络模式挖掘算法研究[D];西安电子科技大学;2012年

5 王乐;数据流模式挖掘算法及应用研究[D];大连理工大学;2013年

6 林耀进;多源环境中数据预处理与模式挖掘的研究[D];合肥工业大学;2014年

7 曾海泉;时间序列挖掘与相似性查找技术研究[D];复旦大学;2003年

相关硕士学位论文 前10条

1 杨阳;云计算环境下时空轨迹伴随模式挖掘研究[D];南京师范大学;2015年

2 李海;基于用户轨迹数据的周期活动模式挖掘[D];江苏科技大学;2015年

3 周青峰;云计算环境下的模式挖掘算法研究[D];浙江工商大学;2015年

4 陈瑞;基于分治子图和极大有序团树的co-location模式挖掘研究[D];云南大学;2015年

5 张子瀚;面向大数据的高效用模式挖掘方法研究[D];北方工业大学;2016年

6 张刚领;一种基于团的闭频繁Co-location模式挖掘方法[D];云南大学;2016年

7 江万国;基于领域驱动的空间高效用Co-location模式挖掘[D];云南大学;2016年

8 吴锡宇;基于约束的城市co-location模式挖掘[D];云南大学;2016年

9 冯鲁桥;基于C/C++代码库的API调用模式挖掘研究及实现[D];电子科技大学;2016年

10 王敏;云计算环境下时空轨迹聚集模式挖掘算法研究[D];南京师范大学;2016年



本文编号:1478321

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1478321.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3a505***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com