基于增量式的时间序列分类算法研究
发布时间:2017-06-26 07:06
本文关键词:基于增量式的时间序列分类算法研究,,由笔耕文化传播整理发布。
【摘要】:近几年来,数据挖掘技术已经应用到很多研究领域中,挖掘的数据类型也越来越复杂.作为研究热点之一的时间序列数据也得到越来越广泛地关注,例如股票交易数据、医学脑电波图像、经济销售预测、手写字迹图像以及人体姿势分析等.所有这些数据都有一个共同的特征,即数据本身是顺序相关的,且都是相同时间间隔内获取的实值型数据,定义具有上述特征的数据为时间序列数据.以上可以看出,使用一般的数据挖掘方法从时间序列数据中进行知识学习是不适用的,并且随着大数据理论的不断发展以及数据特征的不断更新变化,希望能够增量式地处理数据以减小时间序列数据的处理时间以及对存储空间的需求. 本文基于时间序列数据维度高、实值有序、数据间存在自相关性等特点,对时间序列分类过程进行了研究.论文综述了时间序列数据的预处理过程、数据表示技术、相似性度量方法以及时间序列分类现状等几个方面的内容.总结了当前比较流行的时间序列分类方法的研究现状,其中值得一提的是基于shapelet决策树的时间序列分类以及基于shapelets转化的时间序列分类.继而,本文重点研究了基于增量式的时间序列分类算法. 首先,从图像处理的角度出发,提出了一种将图片信息转化为时间序列数据的方法——ITTS方法.正如植物图片信息、手写字迹、人体姿势等图像信息,肉眼直观获取到的信息不能直接应用到时间序列分类方法中,那么本文提出的ITTS方法能够从图像中获取所需要的时间序列数据. 其次,提出了一种基于增量式决策树的时间序列分类算法一—ISDTC算法.传统的时间序列分类算法只能处理静态数据集,本文在此基础上提出的算法能够增量式地处理数据集,其中ISDTC算法是基于增量式决策树的时间序列分类过程.实验表明,本文提出的ISDTC算法最终构建的决策树与使用静态数据集构建的决策树非常相似. 最后,提出了一种基于动态发现shapelets的增量式时间序列分类算法——IPST算法.shapelets作为最能够表示一条时间序列的子序列,随着时间的推移,这个特征序列可能会动态发生变化.基于这样的思想,本文提出的IPST算法能够较好地动态发现当前最优的k个shapelets,从而提高时间序列分类的准确度.
【关键词】:时间序列 分类 图像转化 增量式学习
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13;O211.61
【目录】:
- 致谢5-6
- 摘要6-7
- ABSTRACT7-12
- 1 引言12-16
- 1.1 研究背景和意义12-14
- 1.2 本文工作安排14-15
- 1.3 本文组织结构15-16
- 2 时间序列分类综述16-29
- 2.1 预处理16
- 2.2 表示方法16-18
- 2.2.1 非数据自适应方法17-18
- 2.2.2 数据自适应方法18
- 2.2.3 基于模型的方法18
- 2.3 相似性度量18-23
- 2.3.1 基于形状的度量20-21
- 2.3.2 基于编辑的度量21
- 2.3.3 基于特征的度量21-22
- 2.3.4 基于结构的度量22-23
- 2.3.5 距离度量中的压缩技术23
- 2.4 索引技术23-25
- 2.5 时间序列分类25-26
- 2.6 时间序列分类应用26-28
- 2.7 本章总结28-29
- 3 时间序列分类前期准备29-43
- 3.1 基本决策树理论29-37
- 3.1.1 决策树基本思想29-32
- 3.1.2 决策树基本算法32-33
- 3.1.3 决策树重要技术33-37
- 3.2 图像转化为时间序列37-39
- 3.2.1 图像预处理阶段37-38
- 3.2.2 图像转化为时间序列—ITTS方法38-39
- 3.3 相关工作及定义39-42
- 3.4 本章总结42-43
- 4 基于增量式决策树的时间序列分类43-53
- 4.1 增量式过程的综述43
- 4.2 基于决策树的时间序列分类43-49
- 4.2.1 shapelet的提出44-47
- 4.2.2 基于决策树的时间序列分类47-49
- 4.3 基于增量式决策树的时间序列分类49-52
- 4.3.1 增量式决策树理论49-50
- 4.3.2 基于增量式决策树的时间序列分类50-52
- 4.4 本章总结52-53
- 5 基于shapelets的增量式时间序列分类53-58
- 5.1 基于shapelets的时间序列分类53-55
- 5.1.1 shapelets的提出53-55
- 5.1.2 shapelets与其他分类器的结合55
- 5.2 基于shapelets的增量式时序分类55-57
- 5.3 本章总结57-58
- 6 实验结果及分析58-70
- 6.1 图像转化为时间序列58-61
- 6.1.1 实验平台和数据58-59
- 6.1.2 实验结果分析59-61
- 6.2 基于增量式决策树的时间序列分类61-66
- 6.2.1 实验平台和数据61-62
- 6.2.2 实验结果分析62-66
- 6.3 基于shapelets的增量式时间序列分类66-69
- 6.3.1 实验平台和数据66
- 6.3.2 实验结果分析66-69
- 6.4 本章总结69-70
- 7 总结与展望70-71
- 参考文献71-75
- 作者简历及攻读硕士学位期间取得的研究成果75-77
- 学位论文数据集7
【共引文献】
中国期刊全文数据库 前10条
1 尹阿东,宫雨,吴胜利,武森,高学东,李拥军;增量决策树算法及复杂度分析[J];北京科技大学学报;2004年02期
2 孙宁;;基于数据挖掘的客户关系管理问题的研究[J];科技和产业;2011年06期
3 孙梅玉;唐漾;方建安;;An Improving Indexing Approach on Time Series Based on Minimum Bounding Rectangle[J];Journal of Donghua University(English Edition);2009年01期
4 陈敏雅;石蕾;;基于SVM多分类决策树的研究综述[J];电脑知识与技术;2008年08期
5 李明哲;叶春明;;增量决策树知识获取[J];电脑知识与技术;2009年23期
6 张安勤;叶文s
本文编号:485210
本文链接:https://www.wllwen.com/kejilunwen/yysx/485210.html