当前位置:主页 > 科技论文 > 软件论文 >

一种改进的PrefixSpan算法及其在Web用户行为模式挖掘中的应用

发布时间:2018-03-04 10:32

  本文选题:序列模式挖掘 切入点:Web日志挖掘 出处:《计算机科学》2016年01期  论文类型:期刊论文


【摘要】:序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接递归局部频繁项等方式进行改进,并将改进方法应用于Web用户行为模式挖掘中,对日志记录中的规律进行分析和研究。实验分析表明,相比PrefixSpan算法,该改进算法在算法效率方面有一定的提高。
[Abstract]:Sequential pattern mining is the mining of patterns with high relative time or high frequency of other patterns from the sequence database. Aiming at the problem that the PrefixSpan algorithm has a huge overhead and low scanning efficiency when constructing a projective database. By replacing itemsets with sequence extension, the projection database with sequence number less than threshold min_support and local frequent items with direct recursion are abandoned. The improved method is applied to Web user behavior pattern mining. The experimental results show that the improved algorithm is more efficient than the PrefixSpan algorithm.
【作者单位】: 山西大学计算机与信息技术学院;山西大学计算机智能与中文信息处理教育部重点实验室;
【基金】:国家自然科学基金(61202018,61305057,61303008) 山西省青年科技基金(2013021018-1) 山西省高等学校科技创新项目(2013102)资助
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 王宇新;田佳;郭禾;吴树朋;杨元生;;应用模糊方法的设计模式挖掘策略研究[J];计算机工程与应用;2010年02期

2 陆亿红;王子仁;黄燕;;适合稀少空间特征的同位模式挖掘算法[J];浙江工业大学学报;2007年04期

3 郭燕萍;辛伯宇;;高选票例外模式挖掘研究与实现[J];电脑开发与应用;2007年08期

4 徐显九;杨燕;岳爱萍;;高效的用户移动模式挖掘方法[J];计算机应用研究;2007年09期

5 李帆;夏士雄;张磊;;基于模糊理论的不确定轨迹模式挖掘[J];微电子学与计算机;2011年08期

6 李中元;边馥苓;;空间同位模式挖掘研究进展[J];地理空间信息;2013年06期

7 邢东山,沈钧毅,宋擒豹;用户浏览偏爱模式挖掘算法的研究[J];西安交通大学学报;2002年04期

8 刘洪辉;吴岳芬;;用户行为模式挖掘问题的研究[J];计算机技术与发展;2006年05期

9 付晓翠;许盈;车路;;游戏访问模式挖掘的研究与应用[J];郑州大学学报(理学版);2007年04期

10 颜一鸣;郭鑫;李仁发;;一种非确定树模式挖掘算法[J];计算机工程与应用;2011年15期

相关会议论文 前10条

1 王肃;杜军平;高田;;基于本体与知识背景的模式挖掘框架研究[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年

2 缪裕青;尹东;;分布式存储结构的频繁闭合模式挖掘并行算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年

3 王淼;尚学群;谢华博;李战怀;;行常量差异共表达基因模式挖掘算法研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

4 刘玉葆;蔡嘉荣;印鉴;黄志兰;;基于最大访问模式挖掘的数据库异常行为检测[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年

5 陆叶;王丽珍;陈红梅;赵丽红;;基于可能世界的不确定空间co-location模式挖掘研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

6 王丽珍;陆叶;陈红梅;肖清;;基于前缀树结构的空间co-location模式挖掘算法研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

7 胡伟成;曹三省;李丹;;一种基于QPop增量时域分割升维的媒体内容应用模式挖掘改进算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

8 薛丹;李德敏;裴仁林;;移动计算中基于PrefixSpan算法的用户移动模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

9 宋国杰;马帅;唐世渭;杨冬青;;基于模式挖掘的交通预测模型[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

10 夏庆;马元元;孙志挥;;路径遍历模式挖掘方法的改进[A];第十六届全国数据库学术会议论文集[C];1999年

相关重要报纸文章 前1条

1 辛苑薇;谁将分享“大数据”的智慧盛宴?[N];21世纪经济报道;2012年

相关博士学位论文 前7条

1 Shafqat Ali Shad;移动用户轨迹与行为模式挖掘方法研究[D];中国科学技术大学;2013年

2 钱烽;同位模式挖掘研究[D];浙江大学;2012年

3 刘勇;图模式挖掘技术的研究[D];哈尔滨工业大学;2010年

4 覃桂敏;复杂网络模式挖掘算法研究[D];西安电子科技大学;2012年

5 王乐;数据流模式挖掘算法及应用研究[D];大连理工大学;2013年

6 林耀进;多源环境中数据预处理与模式挖掘的研究[D];合肥工业大学;2014年

7 曾海泉;时间序列挖掘与相似性查找技术研究[D];复旦大学;2003年

相关硕士学位论文 前10条

1 杨阳;云计算环境下时空轨迹伴随模式挖掘研究[D];南京师范大学;2015年

2 岳爱萍;基于时间的用户移动模式挖掘研究[D];西南交通大学;2008年

3 卢荣;基于动态扭曲算法的时间序列部分周期模式挖掘研究[D];天津大学;2009年

4 胡德勇;基于电信数据的模式挖掘与分析[D];北京邮电大学;2010年

5 甘海燕;基于动态链表结构的时间序列异步周期模式挖掘研究[D];天津大学;2010年

6 徐显九;用户移动模式挖掘的研究及应用[D];西南交通大学;2007年

7 丛湘香;大数据下时空同现模式挖掘算法研究[D];华东理工大学;2012年

8 尹金荔;基于相似性度量的图模式挖掘研究[D];西安电子科技大学;2007年

9 席元鸿;时间序列部分周期模式挖掘研究[D];西北师范大学;2011年

10 贾敏杰;树模式挖掘及其在树流分类中的应用研究[D];郑州大学;2012年



本文编号:1565324

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1565324.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3462e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com