基于深度神经网络的时间序列数据异常检测与预测算法研究
发布时间:2021-07-14 11:04
时间序列是一类重要的结构化数据形式,在很多领域都有着重要应用。在航空航天领域,航天器在运行期间产生大量的遥测数据,这些数据以时间序列的形式呈现,能够直观反映各部件的工作状态和运行模式。通过采用时间序列数据挖掘和分析技术对遥测时间序列数据进行检测和预测,有助于实时掌握航天器的健康状况并进行健康管理,是保障航天器正常运行和提高效能的有效手段。本文基于深度神经网络的特点,以实际工程中某设备的时间序列数据为研究对象,深入研究时间序列数据异常检测和多步提前预测方法。主要工作如下:在实际工程中,时间序列数据多以类间不平衡的形式存在,即少数类样本数量远远少于多数类样本数量,学习模型无法从少数类中学习足够的特征,导致少数类的检测精度将会受到严重影响。针对这一问题,我们提出一种代价敏感混合网络(Cost-Sensitive Hybrid Network,CSHN)模型用来解决类间严重偏斜的时间序列数据的异常检测问题。该模型由卷积神经网络(Convolutional Neural Network,CNN)、门控递归单元(Gated Recurrent Unit,GRU)网络以及代价敏感损失函数组成。因此,...
【文章来源】:西安理工大学陕西省
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
图2-1支持向量机对线性可分数据集的示意图
取,并使网络对输入样本的特征变化获得一定不变性,其计算公式:))((1ljljljljbxdownfx(2-16)公式(2-16)式中,和b分别是乘法偏置和加法偏置,down)(是降采样函数,一般情况下,降采样函数将输入特征图划分成多个不重叠的区域,对每个区域求一个统计值。常见的池化方法包括最大值池化、均值池化和随机池化等。最大值池化对池化核连接的局部区域求最大值实现降采样功能;均值池化对池化核连接的局部区域求平均值实现降采样功能;随机池化则根据局部区域内的元素值确定概率矩阵,根据概率矩阵随机选择输出。图2-2展示了三种池化方法的示意图。图2-2三种池化方法的示意图Fig.2-2Schematicdiagramofthreepoolingmethods(3)全连接层与输出层
阒校?魑?判断样本类别的依据。)()(1lllllfxfbxWu(2-17)以CNN网络为例,如图2-3所示为一维时间序列数据分类的CNN网络结构图。其中输入的时间序列数据长度为128,C1和C3层为卷积层,卷积核的分别为321和161,C1层有6个卷积核,C3层有12卷积核,因此C1层输出6个特征图,C3层输出12个特征图;S1层和S2层为池化层,池化核尺寸均为21,因此卷积层输出的特征图经过池化层后,水平、垂直方向的尺寸均下降为原来的一半,特征图数量不变;C5层和F6层为全连接层,节点数分别为192和84;输出节点为2,表示输入时间序列数据的类别。图2-3CNN网络结构Fig.2-3TheCNNnetworkstructure上面介绍了CNN网络内部结构的数学原理和作用,同时也介绍了一个基础的CNN网络结构。由于卷积神经网络不需要过多的数据预处理工作,而且分类性能明显优于传统的机器学习方法,比如2.1节我们介绍的支持向量机。因此,它在分类问题中得到广泛应用,特别是对于海量数据集中的分类问题中,它有着得天独厚的优势。而传统的机器学习方法需要做大量的数据预处理工作,对于数据量大且数据结构比较复杂的时间序列数集,它的分类精度和分类效率都会受到很大的影响。2.3Adaboost回归算法Adaboost回归算法在股票预测、风速预测以及发电量预测等问题上得到了成功应用,因此目前在解决预测问题上广受大家青睐。所以本文在这里介绍Adaboost回归算法,以帮助我们了解Adaboost对于时间序列数据如何预测。Adaboost回归算法[70]是Boosting方法中最流行的一种算法,将多个弱学习模型通过一种的组合方式,形成一个强学习模型,以达到提高预测正确率的目的。下面我们具体介绍Adaboost回归算法过程。输入为样本集)},(,),,(),,{(2211mmyxyxyxT,采用弱学习器算法,弱学习器迭代次数为K。输出为?
【参考文献】:
期刊论文
[1]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[2]一种基于核SMOTE的非平衡数据集分类方法[J]. 曾志强,吴群,廖备水,高济. 电子学报. 2009(11)
本文编号:3284018
【文章来源】:西安理工大学陕西省
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
图2-1支持向量机对线性可分数据集的示意图
取,并使网络对输入样本的特征变化获得一定不变性,其计算公式:))((1ljljljljbxdownfx(2-16)公式(2-16)式中,和b分别是乘法偏置和加法偏置,down)(是降采样函数,一般情况下,降采样函数将输入特征图划分成多个不重叠的区域,对每个区域求一个统计值。常见的池化方法包括最大值池化、均值池化和随机池化等。最大值池化对池化核连接的局部区域求最大值实现降采样功能;均值池化对池化核连接的局部区域求平均值实现降采样功能;随机池化则根据局部区域内的元素值确定概率矩阵,根据概率矩阵随机选择输出。图2-2展示了三种池化方法的示意图。图2-2三种池化方法的示意图Fig.2-2Schematicdiagramofthreepoolingmethods(3)全连接层与输出层
阒校?魑?判断样本类别的依据。)()(1lllllfxfbxWu(2-17)以CNN网络为例,如图2-3所示为一维时间序列数据分类的CNN网络结构图。其中输入的时间序列数据长度为128,C1和C3层为卷积层,卷积核的分别为321和161,C1层有6个卷积核,C3层有12卷积核,因此C1层输出6个特征图,C3层输出12个特征图;S1层和S2层为池化层,池化核尺寸均为21,因此卷积层输出的特征图经过池化层后,水平、垂直方向的尺寸均下降为原来的一半,特征图数量不变;C5层和F6层为全连接层,节点数分别为192和84;输出节点为2,表示输入时间序列数据的类别。图2-3CNN网络结构Fig.2-3TheCNNnetworkstructure上面介绍了CNN网络内部结构的数学原理和作用,同时也介绍了一个基础的CNN网络结构。由于卷积神经网络不需要过多的数据预处理工作,而且分类性能明显优于传统的机器学习方法,比如2.1节我们介绍的支持向量机。因此,它在分类问题中得到广泛应用,特别是对于海量数据集中的分类问题中,它有着得天独厚的优势。而传统的机器学习方法需要做大量的数据预处理工作,对于数据量大且数据结构比较复杂的时间序列数集,它的分类精度和分类效率都会受到很大的影响。2.3Adaboost回归算法Adaboost回归算法在股票预测、风速预测以及发电量预测等问题上得到了成功应用,因此目前在解决预测问题上广受大家青睐。所以本文在这里介绍Adaboost回归算法,以帮助我们了解Adaboost对于时间序列数据如何预测。Adaboost回归算法[70]是Boosting方法中最流行的一种算法,将多个弱学习模型通过一种的组合方式,形成一个强学习模型,以达到提高预测正确率的目的。下面我们具体介绍Adaboost回归算法过程。输入为样本集)},(,),,(),,{(2211mmyxyxyxT,采用弱学习器算法,弱学习器迭代次数为K。输出为?
【参考文献】:
期刊论文
[1]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[2]一种基于核SMOTE的非平衡数据集分类方法[J]. 曾志强,吴群,廖备水,高济. 电子学报. 2009(11)
本文编号:3284018
本文链接:https://www.wllwen.com/shoufeilunwen/boshibiyelunwen/3284018.html