基于DTW和LMNN的多维时间序列相似性分析方法
本文选题:多维时间序列 + 相似性度量 ; 参考:《浙江大学》2017年硕士论文
【摘要】:多维时间序列是现实中广泛存在的一种数据类型,因而对多维时间序列的分析和数据挖掘有着重要的意义。相似性度量作为多维时间序列分析的关键之一,现有的方法存在诸多不足。本文提出一种计算多维时间序列相似度的方法,将衡量单维时间序列相似度的DTW扩展至多维时间序列,并结合度量学习算法LMNN,进而得到对多维时间序列更好的相似性度量效果。本文主要的研究工作如下:(1)DTW是计算单维时间序列相似度的常用方法,其主要缺陷是存在奇异点和高时间复杂度的问题。本文首先针对DTW的奇异点问题提出一种改进方法:通过同时考虑时间序列的数值信息和梯度信息来构造新的特征,在不引入额外参数的条件下解决奇异点问题(称为SDTW)。然后,将特征提取和降维算法PLA与SDTW相结合来解决DTW的高时间复杂度问题(称为PLA-SDTW)。仿真对比实验验证了 SDTW在有效解决DTW奇异点问题的同时,能够提高度量的准确性。进一步地,在保证与SDTW近乎相同度量效果的同时,PLA-SDTW的时间消耗远远小于其他方法。(2)为了度量多维时间序列的相似性,需要将DTW从单维扩展到多维,并需要同时解决多个变量之间的相关性度量。度量学习方法(如常用的LMNN)能够从训练集学习得到特征空间中更好的距离度量准则。本文将DTW与LMNN相结合得到LMNN-DTW模型,用来度量多维时间序列的相似度。首先,使用基于马氏距离的DTW来度量多维时间序列的相似性,通过马氏矩阵来表示多个变量之间的相关性度量。然后,使用LMNN算法,通过最小化特定的损失函数,来优化得到马氏矩阵。仿真对比实验验证了 LMNN-DTW的效果与当前最好的LDML-DTW方法相近,且明显好于其他方法,从而证明了该模型的有效性和优越性。(3)考虑到前文提出的SDTW能够有效地解决DTW奇异点问题,且具有更好的度量准确性,因此用SDTW替换DTW,与LMNN结合得到LMNN-SDTW模型。仿真实验验证了 LMNN-SDTW的效果与当前最好的LDML-DTW方法相近,且优于LMNN-DTW,同时明显好于其他方法,从而证明了 LMNN-SDTW模型对多维时间序列相似性度量的优越性。
[Abstract]:Multi-dimensional time series is a widely existing data type in reality, so it is of great significance to the analysis and data mining of multidimensional time series. Similarity measurement is one of the key problems in multidimensional time series analysis. In this paper, a method to calculate the similarity of multidimensional time series is proposed. The DTW which measures the similarity of one-dimensional time series is extended to multi-dimensional time series, and the measurement learning algorithm LMNNs is combined to obtain a better similarity measurement effect for multi-dimensional time series. The main research work of this paper is as follows: 1 / 1 DTW is a common method to calculate the similarity of single dimensional time series. Its main defect is the existence of singularity and high time complexity. In this paper, an improved method is proposed to solve the singular point problem of DTW by taking into account the numerical and gradient information of time series at the same time to construct new features, and to solve the singular point problem without introducing additional parameters. Then, the feature extraction and dimension reduction algorithm PLA and SDTW are combined to solve the high time complexity problem of DTW (PLA-SDT WN). The simulation results show that SDTW can effectively solve the singular point problem of DTW and improve the accuracy of measurement. Furthermore, the time consumption of PLA-SDTW is much smaller than that of other methods while ensuring the same measurement effect as SDTW.) in order to measure the similarity of multidimensional time series, it is necessary to extend DTW from one-dimensional to multi-dimensional. We also need to solve the correlation measure of multiple variables at the same time. Metric learning methods, such as LMNNs, can obtain better distance metrics in feature spaces from training sets. In this paper, we combine DTW and LMNN to obtain the LMNN-DTW model, which is used to measure the similarity of multidimensional time series. Firstly, the DTW based on Markov distance is used to measure the similarity of multi-dimensional time series, and the correlation measure between multiple variables is represented by Markov matrix. Then, LMNN algorithm is used to optimize the Markov matrix by minimizing the specific loss function. The simulation results show that the effect of LMNN-DTW is close to that of the best LDML-DTW method, and it is obviously better than other methods, which proves the validity and superiority of the model. (3) taking into account the above mentioned SDTW, the singularity point problem of DTW can be solved effectively. And it has better measurement accuracy, so the LMNN-SDTW model is obtained by replacing DTW with SDTW and combining with LMNN. The simulation results show that the effectiveness of LMNN-SDTW is similar to that of the best LDML-DTW method, and is better than that of LMNN-DTW, and it is also better than other methods, which proves the superiority of LMNN-SDTW model in measuring the similarity of multidimensional time series.
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O211.61
【相似文献】
相关期刊论文 前10条
1 向昌盛;周子英;;基于支持向量机的害虫多维时间序列预测[J];计算机应用研究;2010年10期
2 张吉峰;多维时间序列的周期分析[J];系统工程理论与实践;1999年06期
3 曹杰,陶云,田永丽;多维时间序列门限回归模型及其应用[J];气象科学;2002年02期
4 高伟;田铮;;基于条件互信息的多维时间序列图模型[J];控制理论与应用;2008年02期
5 魏岳嵩;田铮;;多维时间序列Granger因果性的一种图模型学习方法[J];系统科学与数学;2011年05期
6 吴承祯,洪伟;林木生长的多维时间序列分析[J];应用生态学报;1999年04期
7 崔涛;多维时间序列模型在洮河红旗站的应用[J];水文;2001年02期
8 黄磊;舒杰;姜桂秀;张继元;;基于多维时间序列局部支持向量回归的微网光伏发电预测[J];电力系统自动化;2014年05期
9 张永生;袁哲明;熊洁仪;周铁军;;基于SVR和CAR的多维时间序列分析及其在生态学中的应用[J];生态学报;2007年06期
10 陆婕,顾圣士,蒋馥;多维时间序列在相空间重构中的应用[J];洛阳大学学报;2002年02期
相关会议论文 前1条
1 卓义宝;冯少荣;薛永生;丁倩蕾;;考虑权重的多维时间序列相似搜索[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
相关硕士学位论文 前7条
1 谭海龙;多维时间序列的分类技术研究[D];浙江大学;2015年
2 杨雪;基于可调参数的证据理论的模糊多维时间序列模型[D];大连海事大学;2017年
3 沈静逸;基于DTW和LMNN的多维时间序列相似性分析方法[D];浙江大学;2017年
4 高歌;多维时间序列分类技术[D];浙江大学;2008年
5 贾瑞;多维时间序列数据挖掘技术研究[D];南京航空航天大学;2009年
6 王守涛;一种基于多维时间序列分析的音乐推荐系统研究与实现[D];南京大学;2014年
7 杨谕黔;多维时间序列学习建模与预测分析[D];北京交通大学;2014年
,本文编号:1886876
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1886876.html