当前位置:主页 > 科技论文 > 软件论文 >

基于偏序的序列模式挖掘算法研究

发布时间:2018-04-18 08:25

  本文选题:数据挖掘 + 序列模式 ; 参考:《四川师范大学》2017年硕士论文


【摘要】:序列模式挖掘是数据挖掘研究的一个重要领域,它在计算机入侵检测、WEB点击流分析、DNA序列分析和购物篮分析等领域有广泛应用。本文首先讨论了序列模式挖掘的基本理论,分析了基于频繁序列和频繁闭序列思想的几个经典序列模式挖掘算法。然后,系统讨论了偏序模式挖掘的基本理论,分析和研究了全局偏序和频繁闭偏序挖掘的典型算法及其优缺点。基于闭序列模式概念和TS-FCPO算法思想,论文提出了挖掘频繁等长闭偏序的EL-FCPO算法。它利用等长序列模式之间匹配时只有序列中的对应的位置才可能匹配的特点,改进了TS-FCPO算法寻找匹配位置时的枚举方式,以提高挖掘速度。等长闭偏序继承了闭偏序的所有优点,且可以表示出具有等长特点的闭序列之间的关系及其确定性趋势。由于等长偏序充分考虑了序列长度相等的序列之间只有序列上对应位置才有可能匹配的特点,使得算法在运用于等长偏序应用场景时的实际复杂度能够降低,时间效率有明显提升。论文成果可以应用于制定图书在线组合促销方案、旅游线路规划和攻略等方面。
[Abstract]:Sequential pattern mining is an important research field in data mining. It is widely used in computer intrusion detection Web click-stream analysis DNA sequence analysis and shopping basket analysis.In this paper, the basic theory of sequential pattern mining is discussed, and several classical sequential pattern mining algorithms based on frequent sequence and frequent closed sequence are analyzed.Then, the basic theory of partial order pattern mining is discussed systematically, and the typical algorithms of global partial order mining and frequent closed partial order mining are analyzed and studied as well as their advantages and disadvantages.Based on the concept of closed sequence pattern and the idea of TS-FCPO algorithm, this paper proposes a EL-FCPO algorithm for mining frequent equal-length closed partial order.It makes use of the feature that only the corresponding position in the sequence can be matched when matching the pattern of the equal-length sequence, and improves the enumeration method of the TS-FCPO algorithm to find the matching position in order to improve the speed of mining.The equal-length closed partial order inherits all the advantages of the closed partial order and can express the relation and deterministic trend of the closed sequence with the characteristics of equal length.Due to the fact that the equal-length partial order fully considers that only the corresponding position on the sequence can be matched between the sequences of equal length, the actual complexity of the algorithm can be reduced when it is applied to the application scene of the equal-length partial sequence.Time efficiency has been significantly improved.The results of this paper can be applied to the development of online book combination promotion plan, travel route planning and strategy.
【学位授予单位】:四川师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP311.13

【参考文献】

相关期刊论文 前10条

1 张亮;赵娜;;序列模式挖掘两种典型算法的研究[J];信息技术;2016年11期

2 李刚;焦谱;文福拴;宋雨;尚金成;何洋;;基于偏序约简的智能电网大数据预处理方法[J];电力系统自动化;2016年07期

3 王晓雪;;基于Apriori的序列模式挖掘算法的研究[J];软件;2014年09期

4 俞东进;郑苏杭;李万清;吴为;;基于BIDE的多核并行闭合序列模式挖掘[J];计算机工程;2012年12期

5 逄玉俊;刘英;陈未如;;基于并发序列模式的偏序模式挖掘[J];沈阳化工大学学报;2011年04期

6 王金龙;徐从富;;启发式全局偏序挖掘算法[J];模式识别与人工智能;2008年02期

7 程舒通;徐从富;但红卫;;基于偏序压缩技术的频繁序列模式数据挖掘[J];计算机工程与应用;2008年03期

8 曲开社;阎俊霞;翟岩慧;;GM偏序图的构建和基于GM偏序图的规则提取[J];计算机工程与应用;2007年36期

9 任家东;宗俊省;李志国;;一种实现偏序约束条件下的序列模式挖掘算法[J];计算机工程与科学;2007年05期

10 张长海;胡孔法;陈凌;;序列模式挖掘算法综述[J];扬州大学学报(自然科学版);2007年01期

相关博士学位论文 前2条

1 徐玉生;频繁模式挖掘算法与剪枝策略研究[D];兰州大学;2008年

2 王金龙;全局和局部相结合的数据挖掘方法及应用研究[D];浙江大学;2007年

相关硕士学位论文 前10条

1 张元;一种基于AdaBoost的组合分类算法研究[D];四川师范大学;2015年

2 熊凯;基于最小位置的频繁序列和闭序列挖掘方法研究[D];东北大学;2012年

3 杨天霞;基于序列模式的序列聚类挖掘算法研究[D];西北师范大学;2010年

4 吴永俊;序列模式挖掘研究[D];安徽大学;2010年

5 张佳;基于闭合序列模式挖掘的数据库入侵检测方法研究[D];燕山大学;2010年

6 刘磊;基于序列模式挖掘的入侵检测算法的研究[D];中国科学技术大学;2009年

7 俞单庆;序列模式挖掘及其在入侵检测中的应用研究[D];南京师范大学;2008年

8 但红卫;基于偏序的频繁序列模式压缩算法研究[D];浙江大学;2007年

9 李洋;闭合序列挖掘模型与算法的研究[D];合肥工业大学;2007年

10 肖轶;从万维网日志中挖掘访问序列模式的算法研究[D];华中科技大学;2004年



本文编号:1767564

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1767564.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e32f4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com