当前位置:主页 > 科技论文 > 数学论文 >

基于变化特征离散化的多维时间序列关联分析

发布时间:2018-04-27 02:38

  本文选题:多维时间序列 + 时间序列表示 ; 参考:《东华大学》2017年硕士论文


【摘要】:随着工程机械上不同类型传感器如温度传感器、压力传感器、湿度传感器等的大规模部署,这些传感器产生了大量的多维度时间序列数据。通过对这些传感器采集的时间序列数据关联分析,可用于发现工程机械各部件工作状况的潜在关联关系。这种潜在关系将为工程机械系统的故障预警和分析提供支持。但是,由于工程机械时间序列具有维度高和数据量大的特点,使得传统的Apriori关联算法无法直接运用。因此,本文从实际的工程机械时间序列数据出发,针对工程机械时间序列具体特点,提出一种适用于工程机械领域多维时间序列的关联分析方法。首先,本文设计了多维时间序列关联分析系统的整体框架,该框架分为预处理模块,离散化模块和关联规则提取模块。预处理模块负责数据清洗和规范化,实现每个时间序列的取值范围的规范化,并使每个时间序列符合高斯分布。另外,离散化模块对规范化的时间序列进行表示和离散化,也就是将数值型数据转化成字符型数据。此外,关联规则提取模块利用改进的时间特性关联方法从离散化的时间序列中提取有效的关联规则。接着,本文详细说明了离散化模块所用到的技术。本文先对流行的PAA+SAX离散化方法进行评估,发现PAA+SAX离散化方法有不足之处。PAA表示方法会改变时间序列规范化的结果。并且PAA表示方法会忽略原始时间序列的关键信息。另外,SAX离散化方法只能表示时间序列的大小特性,并且SAX的前提是时间序列符合高斯分布。然而,本文的数据集大部分不是高斯分布。所以本文对SAX离散化方法进行改进,使其也可以处理非高斯分布的时间序列。针对SAX不能保留原始时间序列关键信息的不足,本文推荐了变化特征离散化方法,它可以处理非高斯分布的时间序列并保留原始时间序列的关键信息。最后,本文详细阐述了关联规则提取模块所用到的时间特性关联方法。该方法改进了传统的Apriori算法。因为传统的Apriori算法不考虑项的时间特性,所以需要改进候选项的生成算法,支持度的计算方法和关联规则生成算法。使得改进的时间特性关联方法不仅可以处理单重时间序列,还可以处理多重时间序列。不仅如此,本文使用频率阈值和支持度阈值来获得异常模式。针对本文数据集的周期性特点,本文推荐了可以减少关联算法运行时间的关键时间片段关联方法。
[Abstract]:With the large-scale deployment of different types of sensors such as temperature sensor, pressure sensor and humidity sensor in construction machinery, these sensors produce a large number of multi-dimensional time series data. Through the correlation analysis of the time series data collected by these sensors, it can be used to find out the potential correlation of the working conditions of the components of construction machinery. This potential relationship will provide support for early warning and analysis of engineering machinery system failures. However, because of its high dimension and large amount of data, the traditional Apriori association algorithm can not be used directly. Therefore, based on the actual construction machinery time series data, according to the specific characteristics of construction machinery time series, this paper proposes a method of correlation analysis suitable for multi-dimensional time series in the field of construction machinery. Firstly, the whole framework of multi-dimension time series association analysis system is designed, which is divided into preprocessing module, discretization module and association rule extraction module. The preprocessing module is responsible for data cleaning and normalization, and realizes the normalization of the value range of each time series, and makes each time series conform to Gao Si distribution. In addition, the discretization module represents and discretizes the normalized time series, that is, converting numeric data into character data. In addition, the association rule extraction module extracts the effective association rules from the discrete time series using the improved time characteristic association method. Then, this paper explains the technology used in the discretization module in detail. In this paper, the popular PAA SAX discretization method is evaluated, and it is found that the PAA SAX discretization method has some shortcomings. The PAA SAX representation method will change the result of time series normalization. And the PAA representation method ignores the key information of the original time series. In addition, sax discretization method can only express the size of time series, and the premise of SAX is that the time series conform to Gao Si distribution. However, most of the data sets in this paper are not Gao Si distribution. So the SAX discretization method is improved to deal with the time series of non-Gao Si distribution. In view of the deficiency that SAX can not retain the key information of original time series, this paper recommends a method of discretization of variation features, which can deal with the time series of non- distribution and retain the key information of original time series. Finally, the time characteristic association method used in the module of extracting association rules is described in detail. This method improves the traditional Apriori algorithm. Because the traditional Apriori algorithm does not consider the time characteristic of the item, it is necessary to improve the candidate term generation algorithm, the support degree calculation method and the association rule generation algorithm. The improved time characteristic correlation method can deal not only with single time series, but also with multiple time series. Moreover, the frequency threshold and the support threshold are used to obtain the abnormal pattern. In view of the periodicity of the data set in this paper, we recommend a critical time segment association method which can reduce the running time of the association algorithm.
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:O211.61

【相似文献】

相关期刊论文 前10条

1 施久玉,杜金观;有限个状态时间序列的某些结果[J];应用数学学报;1990年01期

2 冯希杰;长江三峡及其邻区断裂活动时间序列[J];华南地震;1991年02期

3 王霞,郭嗣琮,刘淑娟;时间序列模糊滑动预测[J];辽宁工程技术大学学报(自然科学版);1999年03期

4 温品人;时间序列预测法的实际应用分析[J];江苏广播电视大学学报;2001年06期

5 许清海;混沌投资时间序列的嬗变[J];漳州师范学院学报(自然科学版);2003年01期

6 程毛林;时间序列系统建模预测的一种新方法[J];数学的实践与认识;2004年08期

7 高洁;长记忆时间序列适应性预测的应用[J];江南大学学报;2004年05期

8 高洁;孙立新;;长记忆时间序列的适应性预测误差的谱密度[J];统计与决策;2006年13期

9 杨钟瑾;;浅谈时间序列的分析预测[J];中国科技信息;2006年14期

10 李健;孙广中;许胤龙;;基于时间序列的预测模型应用与异常检测[J];计算机辅助工程;2006年02期

相关会议论文 前10条

1 周家斌;张海福;杨桂英;;多维多步时间序列预报方法及其应用[A];中国现场统计研究会第九届学术年会论文集[C];1999年

2 马培蓓;纪军;;基于时间序列的航空备件消耗预测[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年

3 卢世坤;李夕海;牛超;陈蛟;;时间序列的非线性非平稳特性研究综述[A];国家安全地球物理丛书(八)——遥感地球物理与国家安全[C];2012年

4 李强;;基于线性模型方法对时间序列中异常值的检测及证券实证分析[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年

5 戴丽金;何振峰;;基于云模型的时间序列相似性度量方法[A];第八届中国不确定系统年会论文集[C];2010年

6 谢美萍;赵希人;庄秀龙;;多维非线性时间序列的投影寻踪学习逼近[A];'99系统仿真技术及其应用学术交流会论文集[C];1999年

7 张大斌;李红燕;刘肖;张文生;;非线性时问序列的小波-模糊神经网络集成预测方法[A];第十五届中国管理科学学术年会论文集(下)[C];2013年

8 黄云贵;;基于时间序列的电网固定资产投资规模研究[A];2012年云南电力技术论坛论文集(文摘部分)[C];2012年

9 李松臣;张世英;;时间序列高阶矩持续和协同持续性研究[A];21世纪数量经济学(第8卷)[C];2007年

10 陈赫;罗声求;;历史横断面数据的时间序列化[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年

相关重要报纸文章 前6条

1 ;《时间序列与金融数据分析》[N];中国信息报;2004年

2 何德旭 王朝阳;时间序列计量经济学:协整与有条件的异方差自回归[N];中国社会科学院院报;2003年

3 刘俏;让数据坦白真相[N];21世纪经济报道;2003年

4 西南证券高级研究员 董先安邋德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年

5 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年

6 任勇邋郑重;中国对世界钢材价格的影响实证分析[N];现代物流报;2007年

相关博士学位论文 前10条

1 张墨谦;遥感时间序列数据的特征挖掘:在生态学中的应用[D];复旦大学;2014年

2 张德成;滑坡预测预报研究[D];昆明理工大学;2015年

3 苗圣法;时间序列的模式检测[D];兰州大学;2015年

4 翁同峰;时间序列与复杂网络之间等价性问题及表征应用研究[D];哈尔滨工业大学;2015年

5 杨婷婷;用Argo浮标结合卫星观测估算北太平洋经向热输运[D];中国科学院研究生院(海洋研究所);2015年

6 史文彬;时间序列的相关性及信息熵分析[D];北京交通大学;2016年

7 原继东;时间序列分类算法研究[D];北京交通大学;2016年

8 卢伟;基于粒计算的时间序列分析与建模方法研究[D];大连理工大学;2015年

9 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年

10 李桂玲;时间序列的分割及不一致发现研究[D];华中科技大学;2012年

相关硕士学位论文 前10条

1 陈健;基于多变量相空间重构的投资组合策略研究[D];华南理工大学;2015年

2 兰鑫;时间序列的复杂网络转换策略研究[D];西南大学;2015年

3 米晓将;区域尺度下月均气温的时空演化格局研究[D];昆明理工大学;2015年

4 张鸣敏;基于支持向量回归的PM_(2.5)浓度预测研究[D];南京信息工程大学;2015年

5 林健;基于改进小世界回声状态网的时间序列预测[D];渤海大学;2015年

6 曹智丽;日气温和干旱指数支持向量回归预测方法[D];南京信息工程大学;2015年

7 高雄飞;基于分形理论的土壤含水量时间序列特性分析[D];长安大学;2015年

8 姚茜;城市安全生产发展目标研究[D];中国地质大学(北京);2015年

9 谢翠颖;苏州社会消费品零售总额简析[D];苏州大学;2015年

10 包仁义;基于时间序列的搜索引擎评估模型算法研究[D];东北师范大学;2015年



本文编号:1808833

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/1808833.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户02452***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com