基于数据挖掘技术的用户异常用电检测系统的研究与实现
发布时间:2022-05-10 20:19
随着电网的快速普及,居民在享受用电便利的同时,供电企业线路损失率居高不下,导致了企业供电成本的提升。而用户的异常用电行为往往就是供电企业线路损失率居高不下的主要原因,严重影响企业的正常运营秩序。在电网信息化程度不断提高的今天,正确的利用信息化电网所提供的海量数据,从大量的用电信息中挖掘有价值的信息用于解决异常用电行为的检测成为了一个热门的研究领域。本文提出了一种基于时间维度和主成分分析法的异常用电检测模型。模型包括数据预处理、基于时间维度的特征构造、主成分分析、xgboost、GBDT、随机森林模型融合这几个部分。然后根据融合的算法模型对异常用电识别系统进行设计与实现。对比传统的机器学习方法模型,本项目着重于通过原始用电负荷数据构造不同时间维度的特征来表征用户用电行为。之后再采用主成分分析法对高维度的特征进行降维,使得最后用于训练的特征都具有不同方面的代表性。在模型的选择方面也不再使用传统的单一模型进行训练,取而代之的是一个融合模型。在模型算法的验证阶段,本文通过使用中国电网提供的真实用电负荷数据做测试,综合三个单一模型的评估结果,及对比本文所采用的融合模型的结果发现,经过融合后的模型...
【文章页数】:84 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 研究背景及意义
1.2 国内外研究现状
1.3 论文研究内容与目标
1.3.1 论文研究内容
1.3.2 研究目标
1.3.3 本人承担任务
1.4 论文组织结构
第二章 系统相关理论及技术介绍
2.1 皮尔逊相关系数
2.2 主成分分析法
2.2.1 主成分分析的基本介绍
2.2.2 主成分分析法的计算步骤
2.3 算法介绍
2.3.1 xgbost算法
2.3.2 GBDT算法
2.3.3 随机森林算法
2.4 PYTHON和DJANGO
2.4.1 Python简介
2.4.2 Django简介
2.5 本章小结
第三章 用户异常用电检测模型的研究
3.1 数据介绍
3.2 数据预处理
3.2.1 数据过滤
3.2.2 缺失值填补
3.2.3 数据归一化
3.3 基于时间维度和相关性的特征构建
3.3.1 日特征构建
3.3.2 月特征构建
3.3.3 季度特征构建
3.3.4 年特征构建
3.3.5 用户用电负荷相关性特征构建
3.4 特征维度规约
3.5 模型构建及融合
3.5.1 随机森林算法模型
3.5.2 GBDT算法模型
3.5.3 xgboost算法模型
3.5.4 算法模型融合
3.6 模型评估与实验结果分析
3.6.1 模型评估方法
3.6.2 单一模型实验结果
3.6.3 融合模型实验结果
3.6.4 实验结果分析
3.7 本章小结
第四章 系统的需求分析和总体设计
4.1 系统需求分析
4.1.1 系统业务分析
4.1.2 系统功能需求分析
4.1.3 系统用例分析
4.1.4 系统非功能需求分析
4.2 系统的总体设计
4.2.1 软件开发平台
4.2.2 软件运行环境
4.2.3 系统设计限制说明
4.2.4 系统架构设计
4.3 系统功能模块设计
4.4 系统数据库设计
4.4.1 数据库实体关系设计
4.4.2 数据库表设计
4.5 本章小结
第五章 系统的模块设计与实现
5.1 数据预处理模块的设计与实现
5.1.1 数据预处理模块流程设计
5.1.2 数据过滤
5.1.3 缺失值填补
5.1.4 数据预处理模块实现
5.1.5 数据预处理结果展示
5.2 基于时间维度的特征构造模块的设计与实现
5.2.1 特征构造模块设计
5.2.2 特征提取
5.2.3 特征规约
5.2.4 数据归一化
5.2.5 特征构造模块实现
5.3 模型训练模块的设计与实现
5.3.1 模型训练模块设计
5.3.2 模型训练模块实现
5.4 模型检测结果展示模块的设计与实现
5.4.1 模型检测结果展示模块设计
5.4.2 模型检测结果展示模块设计模式
5.4.3 模型检测结果展示模块实现
5.4.4 模型展示界面
5.5 本章小结
第六章 论文总结与展望
6.1 论文内容总结
6.2 下一步工作展望
参考文献
致谢
本文编号:3652629
【文章页数】:84 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 引言
1.1 研究背景及意义
1.2 国内外研究现状
1.3 论文研究内容与目标
1.3.1 论文研究内容
1.3.2 研究目标
1.3.3 本人承担任务
1.4 论文组织结构
第二章 系统相关理论及技术介绍
2.1 皮尔逊相关系数
2.2 主成分分析法
2.2.1 主成分分析的基本介绍
2.2.2 主成分分析法的计算步骤
2.3 算法介绍
2.3.1 xgbost算法
2.3.2 GBDT算法
2.3.3 随机森林算法
2.4 PYTHON和DJANGO
2.4.1 Python简介
2.4.2 Django简介
2.5 本章小结
第三章 用户异常用电检测模型的研究
3.1 数据介绍
3.2 数据预处理
3.2.1 数据过滤
3.2.2 缺失值填补
3.2.3 数据归一化
3.3 基于时间维度和相关性的特征构建
3.3.1 日特征构建
3.3.2 月特征构建
3.3.3 季度特征构建
3.3.4 年特征构建
3.3.5 用户用电负荷相关性特征构建
3.4 特征维度规约
3.5 模型构建及融合
3.5.1 随机森林算法模型
3.5.2 GBDT算法模型
3.5.3 xgboost算法模型
3.5.4 算法模型融合
3.6 模型评估与实验结果分析
3.6.1 模型评估方法
3.6.2 单一模型实验结果
3.6.3 融合模型实验结果
3.6.4 实验结果分析
3.7 本章小结
第四章 系统的需求分析和总体设计
4.1 系统需求分析
4.1.1 系统业务分析
4.1.2 系统功能需求分析
4.1.3 系统用例分析
4.1.4 系统非功能需求分析
4.2 系统的总体设计
4.2.1 软件开发平台
4.2.2 软件运行环境
4.2.3 系统设计限制说明
4.2.4 系统架构设计
4.3 系统功能模块设计
4.4 系统数据库设计
4.4.1 数据库实体关系设计
4.4.2 数据库表设计
4.5 本章小结
第五章 系统的模块设计与实现
5.1 数据预处理模块的设计与实现
5.1.1 数据预处理模块流程设计
5.1.2 数据过滤
5.1.3 缺失值填补
5.1.4 数据预处理模块实现
5.1.5 数据预处理结果展示
5.2 基于时间维度的特征构造模块的设计与实现
5.2.1 特征构造模块设计
5.2.2 特征提取
5.2.3 特征规约
5.2.4 数据归一化
5.2.5 特征构造模块实现
5.3 模型训练模块的设计与实现
5.3.1 模型训练模块设计
5.3.2 模型训练模块实现
5.4 模型检测结果展示模块的设计与实现
5.4.1 模型检测结果展示模块设计
5.4.2 模型检测结果展示模块设计模式
5.4.3 模型检测结果展示模块实现
5.4.4 模型展示界面
5.5 本章小结
第六章 论文总结与展望
6.1 论文内容总结
6.2 下一步工作展望
参考文献
致谢
本文编号:3652629
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3652629.html