当前位置:主页 > 科技论文 > 软件论文 >

多元时间序列流跨事务关联规则挖掘

发布时间:2020-10-22 12:18
   随着经济的发展,在金融,医药,地质,气象,电子商务,传感器网络等很多领域都会产生大量的时间序列数据。挖掘时间序列中隐藏的关联关系并且对于后续时间序列进行预测是一个重要的研究方向,对于生产生活具有十分重要的意义。由于时间序列流一般数据量比较大,数据随着时间变化,具有连续性等特点,所以难以采用传统的关联规则挖掘方法直接对时间序列进行有效挖掘。目前对于时间序列数据流关联规则挖掘已经有一定的研究成果。这些研究多针对单时间序列和事务内关联规则的挖掘。而且通常在已经模式化的时间序列上进行关联规则挖掘,对于多时间序列流的跨事务关联规则挖掘的深入研究比较少,且对于关联规则的研究通常忽略了顺序性,大多不能实现增量挖掘关联规则。本课题在时间序列预处理阶段采用ITEO(Improved TEO)的分段线性表示方法,对时间序列数据进行压缩表示。在时间序列聚类时提出IK-Means算法,增加聚类的类间间距,降低了随机选择初始聚类中心的不确定性。本课题采用3个参量(时间长度,数值截距占最低点比率,线段斜率)表示模式,进行归一化度量相似度。在关联规则挖掘过程,设计了基于多时间序列跨事务关联规则的十字链表表示(IAMTL)方法。基于这种存储结构能够表示多条时间序列在固定的时间T内的关联,在时间序列关联规则中加入固定时间T限制,增强关联规则的顺序性。I-IAMTL算法采用修正支持度和置信度,增量的挖掘关联规则,更加符合时间序列数据的特点。在算法挖掘出的关联规则的验证部分采用前后件窗口(PCW)的方法对于关联规则预测的准确性进行了验证。在实际热电厂的数据和股票数据集上通过将已有算法与本课题的IAMTL和I-IAMTL算法对比,显示了本课题所提算法的有效性。
【学位单位】:哈尔滨工业大学
【学位级别】:硕士
【学位年份】:2017
【中图分类】:TP311.13;O211.61
【部分图文】:

时间序列,阈值,算法


图 2-3 时间序列的特征表示方法的自适应方法主要有分段线性表示,符号化表示,奇异值分示方法是应用相对普遍的表示方法。通过不同的线性化方法数据以直观的线段形式表示。分段算法包括全局和局部两种时间序列数据为基点找分段点。局部算法,根据局部特性,从的要求。全局的分段算法有自顶向下算法,自底向上算法。据起点终点连接,看做初始的拟合线段。然后遍历时间序列最远的点,度量此距离与规定的阈值的大小,若是大于阈值点集合。不断循环迭代,直到达到分段数,或者压缩比超过过范围。自底向上算法首先将相邻的两个数据点相连。然后合误差,如果小于规定的误差阈值则合并两条线段。不断迭连接相邻线段的拟合误差都不小于阈值,算法结束。符号化间序列用符号序列表示。奇异值分解方法(SVD)[31]利用主驱动引擎,将高维时间序列降低为低维。这种方法通常应用识别等领域。算法中比较常用的有固定窗口算法,用固定大小的窗口划分

多元时间序列流跨事务关联规则挖掘


创建FP-tree结构

冒号,构造条件,前缀,数字表示


FP-tree 结构如图 2-4。图 2-4 创建 FP-tree 结构 根 据 头 节 点 链 表 顺 序 首 先 从 I5 开 始 。 得 到 条 件< , >2 1 3 , I , I I :1。冒号后面的数字表示频度。其中条件模式基缀模式一起出现的前缀路径的集合。构造条件 FP-tree 如图
【参考文献】

相关期刊论文 前9条

1 袁曾琼;;关于水文时间序列分析方法的研究[J];科技展望;2016年28期

2 李海林;郭崇慧;;时间序列数据挖掘中特征表示与相似性度量研究综述[J];计算机应用研究;2013年05期

3 毕方明;王为奎;陈龙;;基于空间密度的群以噪声发现聚类算法研究[J];南京大学学报(自然科学版);2012年04期

4 李海林;郭崇慧;;基于云模型的时间序列分段聚合近似方法[J];控制与决策;2011年10期

5 赖军;李双庆;;挖掘滑动时间衰减窗口中网络流频繁项集[J];计算机应用研究;2011年03期

6 邱凤翔;司风琪;徐治皋;;电站关联规则的主元分析挖掘方法及传感器故障检测[J];中国电机工程学报;2009年05期

7 吴聪聪;李忠哗;何丕廉;;基于矩阵的最大频繁模式挖掘及其更新算法[J];微电子学与计算机;2007年12期

8 秦亮曦,史忠植;多时间序列跨事务关联分析研究[J];计算机工程与应用;2005年27期

9 ;Principal component cluster analysis of ECG time series based on Lyapunov exponent spectrum[J];Chinese Science Bulletin;2004年18期


相关博士学位论文 前2条

1 周勇;时间序列时序关联规则挖掘研究[D];西南财经大学;2008年

2 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年


相关硕士学位论文 前2条

1 张文开;基于密度的层次聚类算法研究[D];中国科学技术大学;2015年

2 王中义;基于动态支持度的流数据关联规则挖掘[D];哈尔滨工业大学;2014年



本文编号:2851588

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2851588.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5c298***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com