基于机器学习混合模型的用电数据异常检测研究
发布时间:2023-03-23 02:03
随着科技的发展进步与电力体制的改革,人们的用电需求呈不断上升的趋势。同时,互联网行业的兴起以及社会经济的发展,也对电力消耗的持续增长提供了有力的支撑.近年来,大规模的窃电事件时有发生,并且其态势已经从最初的直接粗暴发展为设备智能化、手段专业化、行为隐蔽化、实施规模化的高科技窃电。窃电行为的发生,不仅给电力公司及合法用户带来巨额的经济损失,更对电网造成了不同程度的破坏。在智能电网的建设过程当中,如何对潜在的异常数据进行及时准确的检测,有效地甄别窃电行为,是保障电网安全性和高可靠性的关键。对于上述背景,本文的研究工作主要围绕以下几个方面展开:1.本文首先对当下智能电网的数据流程及存在的窃电现象进行总结,并对近年来国内外关于窃电检测的研究进展进行了梳理。基于各种方法的比较,结合真实的电网异常用电数据集,将全体电力用户划分为长时间跨度用户和短时间跨度两类,并制定合理的数据预处理和特征提取流程,最终生成与类别标签具有较强关联性的特征集合.2.对于存在长时间跨度用电记录的检测对象,本文根据此类用户最近两年的用电行为特征,采用基于XGBoost、Random Forest和Logistics Reg...
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 离群点检测算法研究现状
1.2.2 用电数据异常检测方法研究现状
1.3 本文的主要研究内容
1.4 本文的组织结构
2 系统相关理论与技术
2.1 数据挖掘概述
2.1.1 数据挖掘定义
2.1.2 数据挖掘流程
2.1.3 数据挖掘方法
2.2 基于密度的异常检测
2.3 One-Class SVM算法
2.4 机器学习分类模型
2.4.1 逻辑回归
2.4.2 决策树与随机森林
2.4.3 XGBoost算法
2.5 LSTM深度神经网络模型
3 异常检测数据处理及特征工程
3.1 实验环境及用电数据集
3.1.1 实验环境
3.1.2 数据集简介
3.1.3 原始数据集质量评估
3.2 数据预处理
3.2.1 数据清洗
3.2.2 缺失数据填充
3.2.3 数据不平衡问题的解决方案
3.3 基于不同时间跨度的特征构建
3.3.1 基于月度的特征构建
3.3.2 基于季度的特征构建
3.3.3 基于年度的特征构建
3.3.4 基于重点时间跨度的特征构建
3.3.5 相关性特征构建
3.4 特征筛选
4 模型设计与实验结果分析
4.1 二分类模型评价指标
4.2 适用于长时间跨度用户的混合检测模型
4.2.1 XGBoost子模型
4.2.2 Random Forest子模型
4.2.3 Logistics Regression子模型
4.2.4 混合模型的构建
4.2.5 模型评估与实验结果分析
4.3 针对短时间跨度用户的混合检测模型
4.3.1 Local Outlier Factor子模型
4.3.2 One-Class SVM子模型
4.3.3 LSTM子模型
4.3.4 混合检测模型的构建
4.3.5 模型评估与实验结果分析
4.4 贝叶斯优化超参数
4.4.1 超参数优化策略
4.4.2 实验结果分析
4.5 本章小结
5 总结与展望
5.1 论文工作总结
5.2 展望
参考文献
攻读硕士期间发表论文
致谢
本文编号:3768052
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 离群点检测算法研究现状
1.2.2 用电数据异常检测方法研究现状
1.3 本文的主要研究内容
1.4 本文的组织结构
2 系统相关理论与技术
2.1 数据挖掘概述
2.1.1 数据挖掘定义
2.1.2 数据挖掘流程
2.1.3 数据挖掘方法
2.2 基于密度的异常检测
2.3 One-Class SVM算法
2.4 机器学习分类模型
2.4.1 逻辑回归
2.4.2 决策树与随机森林
2.4.3 XGBoost算法
2.5 LSTM深度神经网络模型
3 异常检测数据处理及特征工程
3.1 实验环境及用电数据集
3.1.1 实验环境
3.1.2 数据集简介
3.1.3 原始数据集质量评估
3.2 数据预处理
3.2.1 数据清洗
3.2.2 缺失数据填充
3.2.3 数据不平衡问题的解决方案
3.3 基于不同时间跨度的特征构建
3.3.1 基于月度的特征构建
3.3.2 基于季度的特征构建
3.3.3 基于年度的特征构建
3.3.4 基于重点时间跨度的特征构建
3.3.5 相关性特征构建
3.4 特征筛选
4 模型设计与实验结果分析
4.1 二分类模型评价指标
4.2 适用于长时间跨度用户的混合检测模型
4.2.1 XGBoost子模型
4.2.2 Random Forest子模型
4.2.3 Logistics Regression子模型
4.2.4 混合模型的构建
4.2.5 模型评估与实验结果分析
4.3 针对短时间跨度用户的混合检测模型
4.3.1 Local Outlier Factor子模型
4.3.2 One-Class SVM子模型
4.3.3 LSTM子模型
4.3.4 混合检测模型的构建
4.3.5 模型评估与实验结果分析
4.4 贝叶斯优化超参数
4.4.1 超参数优化策略
4.4.2 实验结果分析
4.5 本章小结
5 总结与展望
5.1 论文工作总结
5.2 展望
参考文献
攻读硕士期间发表论文
致谢
本文编号:3768052
本文链接:https://www.wllwen.com/kejilunwen/dianlidianqilunwen/3768052.html