基于形态的时间序列相似性研究
本文选题:时间序列 切入点:相似性 出处:《安徽大学》2017年硕士论文
【摘要】:时间序列数据广泛存在于经济金融、气象科学等领域,时间序列的相似性研究具有深刻的理论意义与重要的实际应用价值。时间序列数据挖掘研究中许多算法都是基于某种相似性度量的,时间序列的特征表示方法对相似性度量结果的好坏具有重要影响。本文在对国内外经典时间序列相似度量算法和特征表示方法进行充分分析的基础上,进行了以下研究工作:首先综述了时间序列数据挖掘的研究背景和实际研究意义,指出了时间序列特征表示和相似性度量的研究现状,然后详细介绍了最具代表性的时间序列特征表示方法和相似性度量算法,最后给出了两种改进的时间序列相似性度量算法。因为时间序列本身具有高维度、高噪声的特点,进行相似性度量之前,需要对序列进行特征表示。针对现有的特征表示方法在趋势提取和维度约简中存在局限性导致难以准确高效的提取序列形态趋势的问题,提出一种新的基于趋势的改进斜率距离相似度量算法。该算法首先将经验模态分解方法与分段线性表示方法相结合,经验模态分解方法具有过滤噪声的优点,先用其提取序列的形态趋势,再用PLR分段线性表示方法对趋势序列进行分段形态拟合,优化了特征表示结果。在此基础上结合序列的模式对斜率距离进行改进,克服了斜率距离方法没有考虑模式差异导致的相似度量结果误差较大的缺陷。文中针对基于三元涨落模式的时间序列相似性度量方法模式划分不够细致,无法反映出序列的具体变化趋势问题,还提出了一种新的基于形态模式的相似性度量算法。该算法首先对时间序列进行分段线性表示,在此基础上给出了七元形态模式的划分方法,根据序列在不同时段的分段斜率值,确定分段的形态模式,并将序列的不同形态模式分别用不同的数字表示,从而将时间序列转换成特殊的字符串序列,最后利用最长公共子序列方法计算字符串序列的距离作为时间序列之间的距离。理论分析和仿真实验证明本文提出的两个方法在时间序列的相似性度量工作中度量结果的准确度都有所提高,而且具有稳定性好、对噪声和平移不敏感的特点。
[Abstract]:Time series data widely exist in the fields of economy, finance, meteorology and so on. The research of time series similarity has profound theoretical significance and important practical application value. Many algorithms in time series data mining research are based on some similarity measurement. The feature representation method of time series has an important influence on the similarity measurement results. This paper makes a full analysis of the classical time series similarity measure algorithms and feature representation methods at home and abroad. The following research works are carried out: firstly, the research background and practical significance of time series data mining are summarized, and the research status of time series feature representation and similarity measurement is pointed out. Then, the most representative time series feature representation method and similarity measurement algorithm are introduced in detail. Finally, two improved time series similarity measurement algorithms are given, because the time series itself has the characteristics of high dimension and high noise. In order to solve the problem that the existing feature representation methods have limitations in trend extraction and dimension reduction, it is difficult to extract the trend of sequence morphology accurately and efficiently. A new trend-based improved slope distance similarity algorithm is proposed, which combines the empirical mode decomposition (EMD) method with the piecewise linear representation method, which has the advantages of filtering noise. Firstly, the morphological trend of the sequence is extracted, then the trend sequence is fitted with PLR piecewise linear representation method, and the feature representation results are optimized. On the basis of this, the slope distance is improved by combining the pattern of the sequence. This paper overcomes the shortcoming that the slope distance method does not take into account the pattern difference and the error of similarity measurement result is large. In this paper, the pattern partition of time series similarity measurement method based on ternary fluctuation pattern is not detailed enough. A new similarity measurement algorithm based on morphological pattern is proposed, which firstly represents the time series by piecewise linear representation. On this basis, the method of dividing the seven-element morphological pattern is given. According to the slope value of the sequence in different periods, the segmented morphological pattern is determined, and the different morphological patterns of the sequence are represented by different numbers respectively. To convert a time series into a special string sequence, Finally, the longest common subsequence method is used to calculate the distance of the string sequence as the distance between the time series. The theoretical analysis and simulation experiments prove that the two methods proposed in this paper are used to measure the similarity of the time series. The accuracy of the quantitative results has improved, Moreover, it has good stability and is insensitive to noise and translation.
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O211.61
【相似文献】
相关期刊论文 前10条
1 施久玉,杜金观;有限个状态时间序列的某些结果[J];应用数学学报;1990年01期
2 冯希杰;长江三峡及其邻区断裂活动时间序列[J];华南地震;1991年02期
3 王霞,郭嗣琮,刘淑娟;时间序列模糊滑动预测[J];辽宁工程技术大学学报(自然科学版);1999年03期
4 温品人;时间序列预测法的实际应用分析[J];江苏广播电视大学学报;2001年06期
5 许清海;混沌投资时间序列的嬗变[J];漳州师范学院学报(自然科学版);2003年01期
6 程毛林;时间序列系统建模预测的一种新方法[J];数学的实践与认识;2004年08期
7 高洁;长记忆时间序列适应性预测的应用[J];江南大学学报;2004年05期
8 高洁;孙立新;;长记忆时间序列的适应性预测误差的谱密度[J];统计与决策;2006年13期
9 杨钟瑾;;浅谈时间序列的分析预测[J];中国科技信息;2006年14期
10 李健;孙广中;许胤龙;;基于时间序列的预测模型应用与异常检测[J];计算机辅助工程;2006年02期
相关会议论文 前10条
1 周家斌;张海福;杨桂英;;多维多步时间序列预报方法及其应用[A];中国现场统计研究会第九届学术年会论文集[C];1999年
2 马培蓓;纪军;;基于时间序列的航空备件消耗预测[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
3 卢世坤;李夕海;牛超;陈蛟;;时间序列的非线性非平稳特性研究综述[A];国家安全地球物理丛书(八)——遥感地球物理与国家安全[C];2012年
4 李强;;基于线性模型方法对时间序列中异常值的检测及证券实证分析[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年
5 戴丽金;何振峰;;基于云模型的时间序列相似性度量方法[A];第八届中国不确定系统年会论文集[C];2010年
6 谢美萍;赵希人;庄秀龙;;多维非线性时间序列的投影寻踪学习逼近[A];'99系统仿真技术及其应用学术交流会论文集[C];1999年
7 张大斌;李红燕;刘肖;张文生;;非线性时问序列的小波-模糊神经网络集成预测方法[A];第十五届中国管理科学学术年会论文集(下)[C];2013年
8 黄云贵;;基于时间序列的电网固定资产投资规模研究[A];2012年云南电力技术论坛论文集(文摘部分)[C];2012年
9 李松臣;张世英;;时间序列高阶矩持续和协同持续性研究[A];21世纪数量经济学(第8卷)[C];2007年
10 陈赫;罗声求;;历史横断面数据的时间序列化[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
相关重要报纸文章 前6条
1 ;《时间序列与金融数据分析》[N];中国信息报;2004年
2 何德旭 王朝阳;时间序列计量经济学:协整与有条件的异方差自回归[N];中国社会科学院院报;2003年
3 刘俏;让数据坦白真相[N];21世纪经济报道;2003年
4 西南证券高级研究员 董先安邋德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年
5 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
6 任勇邋郑重;中国对世界钢材价格的影响实证分析[N];现代物流报;2007年
相关博士学位论文 前10条
1 张墨谦;遥感时间序列数据的特征挖掘:在生态学中的应用[D];复旦大学;2014年
2 张德成;滑坡预测预报研究[D];昆明理工大学;2015年
3 苗圣法;时间序列的模式检测[D];兰州大学;2015年
4 翁同峰;时间序列与复杂网络之间等价性问题及表征应用研究[D];哈尔滨工业大学;2015年
5 杨婷婷;用Argo浮标结合卫星观测估算北太平洋经向热输运[D];中国科学院研究生院(海洋研究所);2015年
6 史文彬;时间序列的相关性及信息熵分析[D];北京交通大学;2016年
7 原继东;时间序列分类算法研究[D];北京交通大学;2016年
8 卢伟;基于粒计算的时间序列分析与建模方法研究[D];大连理工大学;2015年
9 胡建明;基于正则化核学习模型的时间序列多步预测的研究与应用[D];兰州大学;2016年
10 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年
相关硕士学位论文 前10条
1 陈健;基于多变量相空间重构的投资组合策略研究[D];华南理工大学;2015年
2 兰鑫;时间序列的复杂网络转换策略研究[D];西南大学;2015年
3 米晓将;区域尺度下月均气温的时空演化格局研究[D];昆明理工大学;2015年
4 张鸣敏;基于支持向量回归的PM_(2.5)浓度预测研究[D];南京信息工程大学;2015年
5 林健;基于改进小世界回声状态网的时间序列预测[D];渤海大学;2015年
6 曹智丽;日气温和干旱指数支持向量回归预测方法[D];南京信息工程大学;2015年
7 高雄飞;基于分形理论的土壤含水量时间序列特性分析[D];长安大学;2015年
8 姚茜;城市安全生产发展目标研究[D];中国地质大学(北京);2015年
9 谢翠颖;苏州社会消费品零售总额简析[D];苏州大学;2015年
10 包仁义;基于时间序列的搜索引擎评估模型算法研究[D];东北师范大学;2015年
,本文编号:1699602
本文链接:https://www.wllwen.com/kejilunwen/yysx/1699602.html