多元时间序列的模式匹配问题研究
发布时间:2017-10-05 01:24
本文关键词:多元时间序列的模式匹配问题研究
【摘要】:在信息技术的带动下,时间序列数据挖掘这一课题渐渐成为研究者们关注的热门话题。相似性查询是完成其他时间序列数据挖掘技术工作的首要步骤,而模式匹配是相似性查询中的一项基础性工作,因此模式匹配在时间序列数据挖掘领域中占据基础而核心的地位。由于多元时间序列本身高维数的特性,导致多元时间序列的模式匹配方法的计算复杂度较高。如果先进行降维处理,再使用模式匹配方法度量降维后的数据的相似性就会解决高维数带来的计算复杂度较高的问题。本文将主成分分析方法加以改进,提出共同主成分分析方法,利用平安银行的股票数据进行仿真实验,检验共同主成分分析方法的优越性,并且在共同主成分分析方法降维的基础上,结合趋势距离模式匹配方法,提出一种有效的多元时间序列模式匹配方法。主要内容如下: 1)由于多元时间序列本身的高维数特性,导致现有的多元时间序列模式匹配方法在度量数据的相似性过程中具有较高的计算复杂度,而主成分分析方法是降维方法中最常用的。针对主成分分析方法的特点,本文提出共同主成分分析方法,该方法是在主成分分析方法的基础上,,对其加以改进。使用Matlab软件,对2013年3月1日到2013年12月27日之间的200组平安银行股票数据中能够表现股票特征的六个属性值,即开盘价、最高价、最低价、收盘价、成交量和成交额,进行仿真实验,并与主成分分析方法进行对比,实验结果表明,共同主成分分析方法与主成分分析方法相比,能够更好地降低原始多元时间序列的维数。 2)深入分析了现有的多元时间序列模式匹配方法的优缺点,引入趋势距离多元时间序列模式匹配方法,并与降维方法结合,提出一种有效的多元时间序列模式匹配方法。为了降低度量过程中的计算复杂度,本文利用共同主成分分析方法,先使用Matlab软件对平安银行从2012年3月1日到2012年12月21日的200组股票数据进行降维处理,再利用趋势距离模式匹配方法对降维后的数据进行模式匹配,并且通过与动态时间弯曲距离方法和奇异值分解方法进行对比实验来验证该方法的有效性。实验结果显示该方法能有效地度量多元时间序列数据的相似性。
【关键词】:多元时间序列 主成分分析 降维 模式匹配
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:O211.61
【目录】:
- 摘要4-5
- Abstract5-9
- 第1章 绪论9-14
- 1.1 课题研究目的和意义9-10
- 1.2 国内外研究概况10-12
- 1.3 论文的结构及创新点12-14
- 第2章 预备知识14-23
- 2.1 时间序列的基本概念14
- 2.2 常用的降维方法14-17
- 2.2.1 离散傅里叶变换方法14-15
- 2.2.2 离散小波变换方法15-16
- 2.2.3 主成分分析方法16-17
- 2.3 常见的一元时间序列模式匹配方法17-18
- 2.3.1 Euclidean 距离方法17
- 2.3.2 动态时间弯曲方法17-18
- 2.4 常见的多元时间序列模式匹配方法18-23
- 2.4.1 Minkowski 距离方法18-19
- 2.4.2 动态时间弯曲距离方法19
- 2.4.3 奇异值分解方法19-20
- 2.4.4 基于点分布特征方法20-23
- 第3章 一种改进的多元时间序列降维方法23-30
- 3.1 引言23
- 3.2 共同主成分分析降维方法23-24
- 3.3 实例研究24-29
- 3.4 小结29-30
- 第4章 一种有效的多元时间序列模式匹配方法30-35
- 4.1 引言30
- 4.2 趋势距离模式匹配方法30-31
- 4.3 实例研究31-33
- 4.4 小结33-35
- 第5章 结论35-36
- 参考文献36-40
- 在学研究成果40-41
- 致谢41
【参考文献】
中国期刊全文数据库 前10条
1 郭小芳;李锋;刘庆华;;一种有效的多元时间序列相似性度量算法分析[J];江西师范大学学报(自然科学版);2013年01期
2 钟清流;蔡自兴;;基于统计特征的时序数据符号化算法[J];计算机学报;2008年10期
3 胡洁;;高维数据特征降维研究综述[J];计算机应用研究;2008年09期
4 李正欣;张凤鸣;李克武;;基于DTW的多元时间序列模式匹配方法[J];模式识别与人工智能;2011年03期
5 陈乾;胡谷雨;;一种新的DTW最佳弯曲窗口学习方法[J];计算机科学;2012年08期
6 李海林;郭崇慧;;时间序列数据挖掘中特征表示与相似性度量研究综述[J];计算机应用研究;2013年05期
7 管河山;姜青山;王声瑞;;基于点分布特征的多元时间序列模式匹配方法[J];软件学报;2009年01期
8 张军;吴绍春;王炜;;多变量时间序列模式挖掘的研究[J];计算机工程与设计;2006年18期
9 毛红保;冯卉;杨建华;刘亚军;;面向相似性查询的时间序列距离度量方法述评[J];计算机工程与设计;2010年19期
10 杨兴江;周勇;;多元时间序列相似性研究[J];西南民族大学学报(自然科学版);2007年04期
本文编号:973991
本文链接:https://www.wllwen.com/kejilunwen/yysx/973991.html