基于滑动窗口的多元时间序列数据动态关联规则挖掘
本文选题:多元时间序列 + 动态关联规则 ; 参考:《哈尔滨工业大学》2016年硕士论文
【摘要】:随着经济的快速发展,在工业生产,金融服务,电子商务,卫星遥感,传感器网络等领域中都会产生大量的数据,这些数据往往都带有时间标签,即时间序列流。挖掘某一个领域多个时间序列流的关联关系是其中一个重要的研究方向。由于时间序列流具有海量性、实时性和连续性等特点,其中的数据和知识都会随着时间的推移而发生变化,传统的关联规则挖掘方法难以对其进行有效挖掘。目前已有一些数据流关联规则挖掘的研究,但是很多都是数据流已经符号化了,或者说数据本身已经代表了一种模式,不需要预处理提取模式。针对多元时间序列的关联规则挖掘的深入研究较少,且很多挖掘都是采用等长的时间长度来提取模式,挖掘出来的规则的每个元模式含有相同的时间长度,也没有考虑到新数据中的规则更令人感兴趣的情况。本课题使用滑动窗口来对时间序列数据进行限制,挖掘其中的动态关联规则即规则随滑动窗口的移动动态变化。由于时间序列数据是连续性的,在挖掘前需要对其进行预处理来提取元模式形成事务集,预处理的过程首先对序列进行线性化近似,对线性化后的序列切割使在同一时间段内每个序列只有一条线段也即一种变化模式,然后将相似的线段增量地聚类,为每一类分配一个符号,这样多元时间序列数据就被符号化了,将同一时间段内的符号组成事务集就可以对其进行关联规则挖掘了。本课题关联挖掘的算法同样是基于滑动窗口的。在滑动窗口维护一个全局的SWIU-tree(Incremental Updating tree based on Sliding Window)来存储已经扫描的事务集的概要结构,通过剪枝策略以去掉SWIU-tree中的不频繁模式和过期的模式。同时,对滑动窗口中不同的基本窗口采取计数衰减的策略,减少历史事务的影响。在实际热电厂的数据和股票数据集上通过将已有算法与本课题SWIU-tree算法对比,显示了本课题所提算法的有效性,可以快速准确地挖掘多元时间序列的关联规则。
[Abstract]:With the rapid development of economy, a lot of data will be produced in the fields of industrial production, financial service, electronic commerce, satellite remote sensing, sensor network and so on. It is an important research direction to mine the association relation of multiple time series flows in a certain field. Because the time series flow has the characteristics of magnanimity, real-time and continuity, the data and knowledge will change with the passage of time, so it is difficult for the traditional association rules mining method to mine them effectively. There have been some researches on data stream association rules mining, but many data streams have been symbolized, or the data itself represents a pattern, which does not need to be preprocessed to extract the schema. There are few in-depth studies on association rules mining for multivariate time series, and many mining methods use equal length of time to extract patterns. Each meta pattern of the extracted rules contains the same length of time. Nor did it take into account the more interesting circumstances of the rules in the new data. In this paper, the sliding window is used to restrict the time series data, and the dynamic association rules are mined, that is, the rules change dynamically with the moving of the sliding window. Because time series data are continuous, it is necessary to preprocess them before mining to extract meta-pattern to form transaction set. The linearized sequence is cut so that there is only one line segment for each sequence in the same time period, that is, a change pattern, and then the similar segments are clustered incrementally to assign a symbol for each class. In this way, the multivariate time series data are symbolized, and the symbols in the same time period constitute the transaction set, which can be mined by association rules. The algorithm of association mining is also based on sliding window. A global SWIU-tree(Incremental Updating tree based on Sliding Window) is maintained in the sliding window to store the outline structure of the scanned transaction set, and the pruning strategy is used to remove the infrequent and expired patterns in the SWIU-tree. At the same time, different basic windows in sliding window are counted and attenuated to reduce the influence of historical transaction. By comparing the existing algorithm with the SWIU-tree algorithm in the data and stock data sets of the actual thermal power plant, the validity of the proposed algorithm is shown, and the association rules of the multivariate time series can be quickly and accurately mined.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 钟颖莉;复合滑动窗口连接算法[J];哈尔滨商业大学学报(自然科学版);2004年03期
2 李峰;肖建华;;时间序列相似性分析中滑动窗口宽度的确定[J];计算机科学与探索;2009年01期
3 闫巧梅;;滑动窗口技术在电信中的应用设计模型[J];电脑开发与应用;2012年07期
4 王伟平,李建中,张冬冬,郭龙江;数据流上周期更新滑动窗口的连接算法[J];哈尔滨工业大学学报;2005年06期
5 裴丽鹊;;一种基于滑动窗口的时间序列异常检测算法[J];巢湖学院学报;2011年03期
6 谭宏强;牛强;;基于滑动窗口及局部特征的时间序列符号化方法[J];计算机应用研究;2013年03期
7 陈川,林亚平;滑动窗口协议分析及其在微机上的模拟实现[J];计算机应用;2000年02期
8 李建中,张冬冬;滑动窗口规模的动态调整算法[J];软件学报;2004年12期
9 伍红茹,黄欣阳,刘双根,蔺大正;最佳滑动窗口编码法及其在快速模幂乘中的应用[J];南昌大学学报(工科版);2005年02期
10 刘陶刚;赵荣彩;姚远;瞿进;;分块存储的滑动窗口数据重用技术[J];计算机应用;2010年05期
相关会议论文 前10条
1 苏东;宋宝燕;杨兴华;欧征宇;于亚新;于戈;;基于滑动窗口语义的聚集计算方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 汪罕;赵加奎;陈立军;;流和滑动窗口模型下的直径计算(英文)[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 贺冉冉;马玲;;基于滑动窗口的非参数趋势检验在气候序列趋势和波动分析中的应用[A];促进科技经济结合,,服务创新驱动发展——蚌埠市科协2012年度学术年会论文集[C];2012年
4 杨宜东;孙志挥;周晓云;;滑动窗口中的变化检测[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 王成江;冉兵;戴迪;吴磊;;基于滑动窗口的动态手写签名局部相关性研究[A];湖北省机械工程学会青年分会2006年年会暨第2届机械学院院长(系主任)会议论文集(下)[C];2006年
6 王伟平;李建中;张冬冬;郭龙江;;数据流上基于时间滑动窗口的连接算法研究[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
7 王栩;李建中;王伟平;;基于滑动窗口的数据流压缩技术及连续查询处理方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
8 闫朝升;李建中;李金宝;;数据流上滑动窗口技术的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 王秋棠;王鹏;周皓峰;汪卫;;基于滑动窗口的概率数据流上的聚集查询[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
10 沈伟;邹建峰;;基于滑动窗口的语音混合算法[A];第二届和谐人机环境联合学术会议(HHME2006)——第15届中国多媒体学术会议(NCMT'06)论文集[C];2006年
相关硕士学位论文 前10条
1 钟阳;基于数据统计分析的变桨系统故障预警方法[D];华北电力大学;2015年
2 熊腾飞;基于滑动窗口的多元时间序列数据动态关联规则挖掘[D];哈尔滨工业大学;2016年
3 柴子峰;基于滑动窗口的弱标记物体检测方法研究[D];哈尔滨工业大学;2016年
4 闫冰;仿真平台中基于滑动窗口的流数据处理策略研究[D];哈尔滨工程大学;2011年
5 王秋棠;基于滑动窗口的概率数据流上的聚集查询[D];复旦大学;2009年
6 贺春亮;基于数据流滑动窗口的降载技术研究[D];燕山大学;2009年
7 严澄;基于滑动窗口的数据流关联规则挖掘研究[D];浙江大学;2010年
8 闫巧梅;N-δ滑动窗口模型下的优化数据流聚类算法[D];太原理工大学;2008年
9 李俊;基于滑动窗口的数据流频繁闭合项集挖掘研究[D];暨南大学;2008年
10 龚云;基于滑动窗口的密度聚类算法研究[D];安徽大学;2011年
本文编号:1936748
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1936748.html