面向物联网时间序列数据深度学习的LSTM方法研究
发布时间:2020-07-27 20:12
【摘要】:随着计算机的性能不断提高,深度学习也得到了长足的发展,其在计算机视觉、机器翻译、语音识别等领域取得了很大的进步。而物联网和智慧城市的部署正在产生大量的时间序列数据。因此将深度学习应用到这些领域已经变成一个重要的研究课题。物联网时序数据的有效分析可以产生非常有价值的信息,将对其终端的物联网应用提供很好的决策基础。本文首先详细研究了物联网的基本架构以及在此架构上产生的时序数据的特征。并针对这些特征进行了详细地数据预处理,这为接下来构建模型搭建了基础。由于传统的统计学方法、机器学习方法、前馈神经网络方法、循环神经网络方法都存在着一定的局限,即预测精度不高、无法抓住时间依赖性特征、只适应于短期预测、容易发生梯度消失或梯度爆炸。通过对前馈神经网络、循环神经网络、LSTM神经网络这些深度学习方法进行深入研究探讨,本文提出了基于LSTM神经网络与多特征融合的物联网时序数据预测模型。该模型是在LSTM网络的基础之上加入了多特征融合层,很好的填补了 LSTM本身无法抽取多特征的缺点。这使得其不仅能很好完成了对物联网数据中时序关系的提炼,又完成了其他外界因素特征对未来数据的影响的抽取。实验结果也表明本文提出的LSTM与多特征融合的物联网时序数据预测模型,能够很好的对长期、短期、甚至弱时间依赖性的物联网时序数据的进行预测。接着针对当前物联网数据中可能存在的数据异常问题,本文结合之前提出的物联网时序数据预测模型,使用正常的数据集对其进行训练,然后使其产生预测残差,并发挥预测残差的优势,进一步利用其构建高斯朴素贝叶斯模型,实现对物联网时间序列数据的异常检测。这并不是简单的模型融合,其很好得利用了改进后的LSTM时序预测模型的产生预测残差,该残差天生带有时序关系,从而使得异常发生的前后事件关系始终保持着强的连接,再进一步发挥高斯朴素贝叶斯模型的优良分类能力实现异常检测。实验结果同时也表明本文提出的异常检测模型在各项指标均优于对比实验中的其他模型。
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP18;TP391.44;TN929.5
【图文】:
且可以在数字域中轻松跟踪。为对象分配唯一标识的技术称为通用唯一标识符逡逑(UUID)。逡逑(2)网络层:网络层是通过无线或有线连接支持的基础设施。物联网中的网逡逑络层连接所有的事物,让他们知道周围的环境。通过网络层,事物可以与连接的逡逑事物共享数据,这对于物联网中的智能事件管理和处理至关重要。此外,网络层逡逑能够聚集来自现有IT基础设施的数据;然后可以将数据传输到高层复杂服务的逡逑决策单元。其中移动智能终端通过蜂窝网络、WIFI接入网络,而传感器通过ZigBee逡逑局域网,蓝牙设备依据蓝牙通信协议,电子标签通过RFID技术。逡逑(3)服务层:服务层是创建和管理用户或应用程序所需的服务。服务层依赖逡逑于中间件技术,该技术是物联网中服务和应用的关键推动者。中间件技术提供了逡逑一个经济高效的平台,硬件和软件平台可以重复使用。实际的服务层由应用程序,逡逑应用程序编程接口(API)以及支持所需应用程序和服务的协议的最低通用要求组逡逑成。逡逑(4)接口层:接口层由与用户或应用程序的交互方法组成。在物联网中,涉逡逑及大量设备;这些设备可以由不同的供应商提供,因此接口层并不总是遵守相同逡逑的标准。常用的接口应用如智能电网、智慧医疗、智能交通。逡逑
逑在物联网中,面向服务的架构(SoA)对服务提供商和用户来说可能是必要逡逑的[49]。SoA以多种方式确保异构设备之间的互操作性。图2.1提供了一个通用的逡逑SoA,它由四个具有不同功能的层组成,如下所示:逡逑(1)
所以范围设置在0度以上),便可筛选掉一些负数的温度值的和异常高。逡逑(2)上下四分位数法。根据数据集本身的分布,构建绘制箱型图。这个数据的低位四分位数到高位四分位数值延伸,中间位置有一条线。决定第一和第三四分位数以外的范围。换句话说,先求出上下四分位数(Q3当IQR是四分位间距(Q3-Q1)时,箱形图的上部将延伸到小于Q3+w*I后一个数据。类似地,箱形图的下部将延伸到大于Ql-w*IQR。除了这外,数据将被视为离群值,并被绘制为单个点。有时会将w设置为不合,迫使箱形图上下边缘显示最大值和最小值。或者,将根据百分位数的(例如[5,95])来设置这个值,以将箱形图的上下边缘设置在数据的特定数处。另外将根据实际情况进行调节w值,一般的默认值为1.5。如图2.3这是一个土壤湿度数据集的箱形图,其w值为默认值1.5。可以发现这的数值分布是不均匀的,一部分数值是集中在一个小范围内,一部分数在一个大范围内,在类似于长尾分布,另外可以发现在超过上边缘时,能是噪声值。逡逑
本文编号:2772317
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP18;TP391.44;TN929.5
【图文】:
且可以在数字域中轻松跟踪。为对象分配唯一标识的技术称为通用唯一标识符逡逑(UUID)。逡逑(2)网络层:网络层是通过无线或有线连接支持的基础设施。物联网中的网逡逑络层连接所有的事物,让他们知道周围的环境。通过网络层,事物可以与连接的逡逑事物共享数据,这对于物联网中的智能事件管理和处理至关重要。此外,网络层逡逑能够聚集来自现有IT基础设施的数据;然后可以将数据传输到高层复杂服务的逡逑决策单元。其中移动智能终端通过蜂窝网络、WIFI接入网络,而传感器通过ZigBee逡逑局域网,蓝牙设备依据蓝牙通信协议,电子标签通过RFID技术。逡逑(3)服务层:服务层是创建和管理用户或应用程序所需的服务。服务层依赖逡逑于中间件技术,该技术是物联网中服务和应用的关键推动者。中间件技术提供了逡逑一个经济高效的平台,硬件和软件平台可以重复使用。实际的服务层由应用程序,逡逑应用程序编程接口(API)以及支持所需应用程序和服务的协议的最低通用要求组逡逑成。逡逑(4)接口层:接口层由与用户或应用程序的交互方法组成。在物联网中,涉逡逑及大量设备;这些设备可以由不同的供应商提供,因此接口层并不总是遵守相同逡逑的标准。常用的接口应用如智能电网、智慧医疗、智能交通。逡逑
逑在物联网中,面向服务的架构(SoA)对服务提供商和用户来说可能是必要逡逑的[49]。SoA以多种方式确保异构设备之间的互操作性。图2.1提供了一个通用的逡逑SoA,它由四个具有不同功能的层组成,如下所示:逡逑(1)
所以范围设置在0度以上),便可筛选掉一些负数的温度值的和异常高。逡逑(2)上下四分位数法。根据数据集本身的分布,构建绘制箱型图。这个数据的低位四分位数到高位四分位数值延伸,中间位置有一条线。决定第一和第三四分位数以外的范围。换句话说,先求出上下四分位数(Q3当IQR是四分位间距(Q3-Q1)时,箱形图的上部将延伸到小于Q3+w*I后一个数据。类似地,箱形图的下部将延伸到大于Ql-w*IQR。除了这外,数据将被视为离群值,并被绘制为单个点。有时会将w设置为不合,迫使箱形图上下边缘显示最大值和最小值。或者,将根据百分位数的(例如[5,95])来设置这个值,以将箱形图的上下边缘设置在数据的特定数处。另外将根据实际情况进行调节w值,一般的默认值为1.5。如图2.3这是一个土壤湿度数据集的箱形图,其w值为默认值1.5。可以发现这的数值分布是不均匀的,一部分数值是集中在一个小范围内,一部分数在一个大范围内,在类似于长尾分布,另外可以发现在超过上边缘时,能是噪声值。逡逑
【参考文献】
相关期刊论文 前5条
1 黄建国;罗航;王厚军;龙兵;;运用GA-BP神经网络研究时间序列的预测[J];电子科技大学学报;2009年05期
2 潘迪夫;刘辉;李燕飞;;基于时间序列分析和卡尔曼滤波算法的风电场风速预测优化模型[J];电网技术;2008年07期
3 佟伟民;李一军;单永正;;基于小波分析的时间序列数据挖掘[J];计算机工程;2008年01期
4 刘峰;瞿俊;;基于聚类分析和神经网络的时间序列预测方法[J];微电子学与计算机;2006年09期
5 王晓晔,王正欧;正则化训练的神经网络与粗集理论相结合的股票时间序列数据挖掘技术[J];电子与信息学报;2004年04期
本文编号:2772317
本文链接:https://www.wllwen.com/kejilunwen/wltx/2772317.html