当前位置:主页 > 科技论文 > 软件论文 >

基于LOF的快速密度峰值聚类的电力数据异常值检测方法研究

发布时间:2023-10-26 19:02
  随着智能电网建设和电力系统信息化的提速,电力企业积累了体量巨大的数据,这些数据主要来源于电网的发、输、变、配、用电等五大环节。对电力数据进行分析研究对我国电网向数字化、智能化发展有着重要的意义。异常数据产生的原因主要有属性值缺失,异常用电行为,电力设备故障等。如果在对电力数据进行分析前不事先处理这些原始的污染数据,将对数据分析的准确性有很大的影响。同时,异常数据检测能够发现异常数据以及背后隐藏的信息,对电网的安全运行有着重要的参考意义。通过数据驱动的方法对电力数据进行异常检测,能够实现对电能异常状态的监测,加快电网排查异常现象的反应速度,提高了电网的稳定性,同时减少运行成本,降低电网企业的经济损失。电力数据异常值检测是电力数据研究的基础工作,目前传统的电力数据分析方法已经无法处理如此复杂且大体量的数据,寻找一种适用于处理当前电力系统数据的方法十分必要。文中对比了K-Means、基于密度的聚类和快速密度峰值聚类算法的优缺点,得出快速密度峰值聚类算法在处理电力数据时具有明显优势,故本文选择快速密度峰值聚类算法的对电力数据进行研究。在此基础上提出了一种基于局部异常因子(Local Outli...

【文章页数】:58 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 电力数据研究现状
        1.2.2 异常值检测研究现状
        1.2.3 负荷曲线聚类研究现状
    1.3 本文的主要内容和结构
第2章 相关技术准备
    2.1 数据驱动技术
        2.1.1 数据驱动定义
        2.1.2 数据驱动的过程
    2.2 数据挖掘任务
    2.3 数据清洗
    2.4 常用降维算法
        2.4.1 常见特征选择方法
        2.4.2 常见特性提取
    2.5 聚类分析算法
        2.5.1 K-Means算法
        2.5.2 DBSCAN算法
        2.5.3 快速密度峰值聚类算法
    2.6 本章小结
第3章 异常数据检测方法研究
    3.1 异常值检测算法
        3.1.1 基于距离的异常值检测
        3.1.2 基于密度的异常值检测
        3.1.3 基于聚类的异常值检测
        3.1.4 快速密度峰值聚类算法的局限性
    3.2 基于LOF的快速密度峰值异常值检测
        3.2.1 算法描述
        3.2.2 异常值判定规则
    3.3 仿真实验
        3.3.1 案例一
        3.3.2 案例二
    3.4 小结
第4章 基于改进快速密度峰值算法的电力负荷数据聚类
    4.1 主成分分析法降维
    4.2 快速密度峰值聚类算法描述
    4.3 改进的快速密度峰值聚类算法
        4.3.1 算法描述
        4.3.2 仿真实验
    4.4 本章小结
总结与展望
参考文献
致谢
附录A 攻读硕士学位期间发表的学术论文目录
附录B 攻读硕士学位期间参与的科研项目



本文编号:3856798

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3856798.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户42625***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com