基于机器学习的时间序列分析方法研究与应用
发布时间:2021-08-16 10:07
时间序列分析是人类认识与探索自然规律的一种普遍方式。为了准确预测时间序列数据,机器学习作为人工智能领域研究的基础,对复杂时间序列分析有着绝对的优势,因此研究机器学习算法对分析时间序列有着重要的意义。针对传统时间序列分析方法对时间序列预测准确度不高问题,提出一种改进的SAM-LSTM融合算法。通过研究目前针对时间序列预测效果较好且基于机器学习的通用算法支持向量机(SVM)与循环神经网络(RNN)的方法,发现SVM主要是对线性可分数据进行分类的方法,RNN虽然对序列有着保存以往信息能力,但容易发生梯度消失现象导致预测效果不佳。长短期记忆神经网络(LSTM)是为了解决RNN无法处理远距离长序列依赖问题,通过加入门结构方式很好地避免了发生梯度消失问题;自注意力机制(SAM)的目的是帮助模型对每个样本数据赋予不同的权重,提取出影响数据分析预测的关键信息。构建SAM-LSTM融合算法,综合两者算法的各自优势,实验选取电力负荷需求量数据和日最高温度气象数据,对比SVM算法、RNN算法、LSTM算法以及SAM-LSTM算法对时间序列预测准确度及误差值,评估指标为平均绝对误差(MAE),平均绝对百分比误...
【文章来源】:西安科技大学陕西省
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
研究思路图
2传统的时间序列分析方法11(3)多维度:数据产生不单单只有一个属性,多属性共存情况下必然会有特征的冗余,数据间的干扰,在学习训练过程中模型势必会有所影响。如果高维度数据未经处理降维,就会增加数据整体的复杂度,这样许多传统的机器学习方法预测也是效果不佳的。(4)海量性:随着大数据时代的来临,每天都会产生海量级的时间序列数据,也因此产生了数据云的概念。(5)周期性:某个变量因外部环境变化如季节或事件高峰期出现交替现象的规律等。(6)趋势性:某因素按照时间次序的发展或者随自变量改变,整体数据变化存在持续升高、下坡趋势或短暂性保持不变的动态平衡趋势,变动幅度略有不等。(7)综合性:序列构成是由多种变化情况线性相加或组合的形式。在进行预测时应该尽可能剔除掉不相关干扰数据,着重体现其变动的周期性、趋势性等特点。2.1.3时间序列的种类按数据的表现形式将时间序列分为:绝对数时间序列、相对数时间序列、平均数时间序列[32]。如图2.1所示。(1)绝对数时间序列它定义为一系列的同一类型的总量指标数据以时间发生的前后次序而排列构成的一组序列,表明此序列在多个时间段内处于绝对水平,也称为总量指标时间序列。绝对数时间序列由时点序列和时期序列构成。如下图2.2和2.3所示。图2.1绝对数时间序列、相对数时间序列、平均数时间序列①时期序列包含的每个数据对应的是时期指标,代表每个数据现象发生于每个时间段中的总量,时点序列包含的每个数据对应的是时点指标,描述其每个数据发生现象于每个时点位置所保持的状态和达到的水平。
西安科技大学全日制工程硕士学位论文12②时间序列中,各数据间的时期序列可以彼此相加,而时点序列数据不具有可加性。③时期序列它的数值大小的直接影响因素与数据所处的时间长短有关,时点序列它的各个时点数据的数值大小和时点间隔长短无直接性的关系。④时间序列中,时期序列数据表示对每个时间段所发生的数据量进行连续不间断的统计,时点序列数据则不要求连续统计,且它不可能存在连续发生的现象。图2.2时期序列图2.3时点序列(2)相对数时间序列指由同类型系列的同一种类的相对数遵照时间发生的前后次序组成的序列,可以体现数据现象相对水平或者是数量间的一种动态对比关系。(3)平均数时间序列由一系列同类的平均数按时间先后顺序排列而成的序列,反映现象一般水平发展变化过程和趋势。本文所采用的数据集为绝对数时间序列中的时点序列,分别为2019年7月1日00:00至2019年9月1日00:00每半小时采取一次的约3000条澳大利亚电力负荷需求量数据和2018年12月30日至2019年12月28日采取具有代表性的两个省会城市日最高气温气象数据(1年365组)。2.2传统时间序列分析方法传统时间序列分析方法主要包含两类:描述性的时间序列分析和基于数理统计的时间序列分析。描述性的分析方法主要通过直接对比观察数据间不同或者绘制图像来分析,探寻序列间潜藏的规律,把这种直观简单的观测方法定义为描述性时间序列方法,它的特点是操作方便、直观高效等,当然此方法也为数理统计分析时序序列的开端。后者分析方法是基于数学和计量统计学的。而人们对传统时间序列预测方法的研究
【参考文献】:
期刊论文
[1]基于LSTM神经网络的金融时间序列预测[J]. 欧阳红兵,黄亢,闫洪举. 中国管理科学. 2020(04)
[2]基于多目标支持向量机的ADHD分类[J]. 杜海鹏,邵立珍,张冬辉. 工程科学学报. 2020(04)
[3]基于Wide&Deep-LSTM模型的短期台区负荷预测[J]. 吕海灿,王伟峰,赵兵,张毅,郭秋婷,胡伟. 电网技术. 2020(02)
[4]长短期记忆网络预测混沌时间序列[J]. 熊有成,赵鸿. 中国科学:物理学 力学 天文学. 2019(12)
[5]基于维度加权的残差LSTM短期交通流量预测[J]. 李月龙,唐德华,姜桂圆,肖志涛,耿磊,张芳,吴骏. 计算机工程. 2019(06)
[6]基于LSTM的化肥价格指数预测[J]. 周杨,周林立,刘磊. 仪表技术. 2019(04)
[7]基于RNN-LSTM的磨矿系统故障诊断技术[J]. 曲星宇,曾鹏,李俊鹏. 信息与控制. 2019(02)
[8]永磁同步电机有限控集模型预测电流控制预测误差分析[J]. 李键,牛峰,黄晓艳,方攸同. 电机与控制学报. 2019(04)
[9]基于Keras的LSTM模型在空气质量指数预测的应用[J]. 郑洋洋,白艳萍,侯宇超. 数学的实践与认识. 2019(07)
[10]基于BiRNN的维吾尔语情感韵律短语注意力模型[J]. 帕丽旦·木合塔尔,买买提阿依甫,杨文忠,吾守尔·斯拉木. 电子科技大学学报. 2019(01)
博士论文
[1]基于机器学习的时间序列模型研究及其应用[D]. 杨玉军.电子科技大学 2018
本文编号:3345471
【文章来源】:西安科技大学陕西省
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
研究思路图
2传统的时间序列分析方法11(3)多维度:数据产生不单单只有一个属性,多属性共存情况下必然会有特征的冗余,数据间的干扰,在学习训练过程中模型势必会有所影响。如果高维度数据未经处理降维,就会增加数据整体的复杂度,这样许多传统的机器学习方法预测也是效果不佳的。(4)海量性:随着大数据时代的来临,每天都会产生海量级的时间序列数据,也因此产生了数据云的概念。(5)周期性:某个变量因外部环境变化如季节或事件高峰期出现交替现象的规律等。(6)趋势性:某因素按照时间次序的发展或者随自变量改变,整体数据变化存在持续升高、下坡趋势或短暂性保持不变的动态平衡趋势,变动幅度略有不等。(7)综合性:序列构成是由多种变化情况线性相加或组合的形式。在进行预测时应该尽可能剔除掉不相关干扰数据,着重体现其变动的周期性、趋势性等特点。2.1.3时间序列的种类按数据的表现形式将时间序列分为:绝对数时间序列、相对数时间序列、平均数时间序列[32]。如图2.1所示。(1)绝对数时间序列它定义为一系列的同一类型的总量指标数据以时间发生的前后次序而排列构成的一组序列,表明此序列在多个时间段内处于绝对水平,也称为总量指标时间序列。绝对数时间序列由时点序列和时期序列构成。如下图2.2和2.3所示。图2.1绝对数时间序列、相对数时间序列、平均数时间序列①时期序列包含的每个数据对应的是时期指标,代表每个数据现象发生于每个时间段中的总量,时点序列包含的每个数据对应的是时点指标,描述其每个数据发生现象于每个时点位置所保持的状态和达到的水平。
西安科技大学全日制工程硕士学位论文12②时间序列中,各数据间的时期序列可以彼此相加,而时点序列数据不具有可加性。③时期序列它的数值大小的直接影响因素与数据所处的时间长短有关,时点序列它的各个时点数据的数值大小和时点间隔长短无直接性的关系。④时间序列中,时期序列数据表示对每个时间段所发生的数据量进行连续不间断的统计,时点序列数据则不要求连续统计,且它不可能存在连续发生的现象。图2.2时期序列图2.3时点序列(2)相对数时间序列指由同类型系列的同一种类的相对数遵照时间发生的前后次序组成的序列,可以体现数据现象相对水平或者是数量间的一种动态对比关系。(3)平均数时间序列由一系列同类的平均数按时间先后顺序排列而成的序列,反映现象一般水平发展变化过程和趋势。本文所采用的数据集为绝对数时间序列中的时点序列,分别为2019年7月1日00:00至2019年9月1日00:00每半小时采取一次的约3000条澳大利亚电力负荷需求量数据和2018年12月30日至2019年12月28日采取具有代表性的两个省会城市日最高气温气象数据(1年365组)。2.2传统时间序列分析方法传统时间序列分析方法主要包含两类:描述性的时间序列分析和基于数理统计的时间序列分析。描述性的分析方法主要通过直接对比观察数据间不同或者绘制图像来分析,探寻序列间潜藏的规律,把这种直观简单的观测方法定义为描述性时间序列方法,它的特点是操作方便、直观高效等,当然此方法也为数理统计分析时序序列的开端。后者分析方法是基于数学和计量统计学的。而人们对传统时间序列预测方法的研究
【参考文献】:
期刊论文
[1]基于LSTM神经网络的金融时间序列预测[J]. 欧阳红兵,黄亢,闫洪举. 中国管理科学. 2020(04)
[2]基于多目标支持向量机的ADHD分类[J]. 杜海鹏,邵立珍,张冬辉. 工程科学学报. 2020(04)
[3]基于Wide&Deep-LSTM模型的短期台区负荷预测[J]. 吕海灿,王伟峰,赵兵,张毅,郭秋婷,胡伟. 电网技术. 2020(02)
[4]长短期记忆网络预测混沌时间序列[J]. 熊有成,赵鸿. 中国科学:物理学 力学 天文学. 2019(12)
[5]基于维度加权的残差LSTM短期交通流量预测[J]. 李月龙,唐德华,姜桂圆,肖志涛,耿磊,张芳,吴骏. 计算机工程. 2019(06)
[6]基于LSTM的化肥价格指数预测[J]. 周杨,周林立,刘磊. 仪表技术. 2019(04)
[7]基于RNN-LSTM的磨矿系统故障诊断技术[J]. 曲星宇,曾鹏,李俊鹏. 信息与控制. 2019(02)
[8]永磁同步电机有限控集模型预测电流控制预测误差分析[J]. 李键,牛峰,黄晓艳,方攸同. 电机与控制学报. 2019(04)
[9]基于Keras的LSTM模型在空气质量指数预测的应用[J]. 郑洋洋,白艳萍,侯宇超. 数学的实践与认识. 2019(07)
[10]基于BiRNN的维吾尔语情感韵律短语注意力模型[J]. 帕丽旦·木合塔尔,买买提阿依甫,杨文忠,吾守尔·斯拉木. 电子科技大学学报. 2019(01)
博士论文
[1]基于机器学习的时间序列模型研究及其应用[D]. 杨玉军.电子科技大学 2018
本文编号:3345471
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3345471.html