当前位置:主页 > 科技论文 > 软件论文 >

电力大数据的信息价值密度评价与提升方法研究

发布时间:2023-08-14 19:57
  智能电网的信息化建设积累了大量数据资源,电力系统已经进入了“大数据”时代,而如何提升电力大数据的信息价值密度是目前研究的重点。针对目前价值密度的研究存在缺乏定义和量化指标、提升手段单一导致效果有限的问题,本文围绕价值密度研究课题,从价值密度的定义,评价指标的建立,提升方法的研究,到实验仿真的验证都展开了研究分析。本文提出了电力大数据价值密度的定义及评价指标。其中,价值密度评价指标分别从空间上内存占用、时间上运行速率两个维度计算,并且也计及了数据挖掘结果的误差。本文分别从“脏数据”、记录、字段的维度出发,将提升价值密度的技术路线总结为“三层过滤机制”——面向数据库的“脏数据”过滤、基于改进K-means算法的记录“横向”过滤以及基于FP-network算法的字段“纵向”过滤,并针对每一层过滤进行了深入研究和阐述。第一层过滤总结了常见的“脏数据”类型、产生原因及其相应处理方法;第二层过滤基于多初始聚类中心、多机组并行处理的改进K-means算法实现了记录维度的“横向”过滤;第三层过滤提出了FP-network算法,不仅继承了FP-growth算法的优点,而且只需扫描一次数据库,也方便数据库...

【文章页数】:86 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 研究背景和意义
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 目前研究存在的主要问题
    1.4 本文主要内容
第二章 电力大数据的信息价值密度
    2.1 电力大数据的特征分析、技术模型及其应用
        2.1.1 电力大数据的特征分析
        2.1.2 电力大数据的技术模型
        2.1.3 在智能电网中的应用
    2.2 价值密度定义
    2.3 价值密度评价指标
    2.4 本章小结
第三章 面向数据库的“脏数据”过滤
    3.1 基于电力业务的数据库过滤
    3.2 常见的“脏数据”类型及原因
    3.3 “脏数据”处理方法
    3.4 小结
第四章 基于改进K-MEANS算法的记录“横向”过滤
    4.1 常见聚类算法比较
        4.1.1 层次聚类算法
        4.1.2 DBSCAN聚类算法
        4.1.3 混合高斯法
        4.1.4 K-means算法
    4.2 改进K-means聚类算法
        4.2.1 改进K-means算法流程
        4.2.2 改进K-means算法性能检验
    4.3 算例分析
    4.4 小结
第五章 基于FP-NETWORK算法的字段“纵向”过滤
    5.1 常见关联分析
        5.1.1 Apriori算法
        5.1.2 FP-growth算法
    5.2 FP-network算法
        5.2.1 FP-network算法的网络图形式
        5.2.2 FP-network算法的矩阵形式
        5.2.3 FP-network算法的具体流程
        5.2.4 与其他关联规则算法的比较
    5.3 算例分析
        5.3.1 实验环境和数据
        5.3.2 算例分析过程
        5.3.3 算例分析结论
    5.4 小结
第六章 实验仿真
    6.1 实验平台
    6.2 “三层过滤机制”处理过程
        6.2.1 面向数据库的“脏数据”过滤
        6.2.2 基于改进K-means算法的记录“横向”过滤
        6.2.3 基于FP-network算法的字段“纵向”过滤
    6.3 价值密度评价结果分析
第七章 结论与展望
    7.1 结论
    7.2 展望
参考文献
致谢
攻读硕士学位期间已发表或录用的论文



本文编号:3841963

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3841963.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f6a93***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com