基于关联分析的电能质量数据清洗方法研究
发布时间:2021-06-06 00:05
近年来,新能源发电、高速铁路、电动汽车、变频器等各种电能质量干扰源在电网广泛分布,其随机波动性、非线性特点显著,导致公用电网的供电电能质量问题恶化。正在建设的电网谐波监测分析系统实时汇集全网电能质量数据,使得数据驱动的电能质量问题分析与决策成为可能。但电网监测终端数量多,存储系统组成复杂、物理环境恶劣等原因都会造成采集的数据存在缺失、异常等数据质量问题,这些数据问题会导致错误的分析结果,影响电能质量治理决策效果。针对上述问题,根据电能质量监测数据数据采集频率高且监测指标类别众多的特点,提出多指标关联分析方法,研究电能质量监测数据中的缺失数据填充以及异常数据的检测技术。开展的主要工作包括:1、以对电能质量监测数据的缺失值填充为研究目标,根据监测指标类别众多,量测指标存在强相关性的特点,提出基于量测指标相关性的缺失值填充方法。该方法首先引入归一化互信息方法,弥补传统皮尔逊相关系数的不足,计算量测指标相关性,得出强相关指标。然后利用局部加权回归算法对得到的指标进行回归分析建立强相关指标间的回归数学模型,最后利用该模型进行填充。实验结果表明:基于量测指标相关性的缺失数据填充方法具有较高的准确性...
【文章来源】:北方工业大学北京市
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
图1-4量测指标编码结构示意图??-
用于监察生产过程是否产生异常以及过程是否受控。控制图上通常有三条控制线:??中心线(统计样本的平均值)、上控制线和下控制线(上下控制线与中心线相距??数倍标准差),并有按顺序抽取的样本描点序列,如图2-1所示。若控制图中的??描点落在上控制线与下控制线之外或描点在控制线之间的排列不随机,则表明过??程异常。??VCL????CL?___/_??LCL??i?l?i?I?i?i?i?I??1?2?3?4?5?6?78??图2-1控制图示例??控制图可分为两类,一类是计量值控制图,通常用于观察样本数值分布的变??化,;一类是计数型控制图,主要用于发现生产过程中的异常,控制生产的过程。??常见的计量值控制图有均值-极差控制图、均值-标准差控制图、单值-极差控??制图等。??均值图(I)具有适用范围广,灵敏度高的特点,若X服从正态分布,则又-也??服从正态分布;若X非正态分布,当样本量充分大时,1近似服从正态分布[29]。??均值-标准差图由均值(又)图和标准差(S)图共同组成。与又-R图相对应,又图??主要用来判断生产过程的均值是否稳定;S图用来判断生产过程标准差的稳定程??度。依照习惯把X图列在上方,而把S图列在下方。一般来说,组中样本量大于??14??
互信息计算过程如下:??数据中获取所有监测指标的数据,根据采样周期,对比应收实收数据量CountAcu,如果CourrtRec=CountAcu,则该监测则该指标存在数据缺失。存在数据缺失的指标为待测指标,样周期一致的指标作为待选指标。一一选取待选指标的监测待测指标的监测数据重组排序形成数据集,使用式2-4对数的计算,为了更好地对互信息进行比较,消除数据量带来的一化为归一化互信息NMI。选择归一化互信息NMI最大且N作为相关指标。??分析??量相关性的归一化互信息,通过实验验证归一化互信息对电相关性的可行性与结果的准确性。本实验选取5个小时的数果相关系数进行比较。??能质量监测数据是由监测点,监测指标,时间戳以及监测值
【参考文献】:
期刊论文
[1]一种基于k-means的两阶段用电异常检测方法[J]. 张铁峰,张靖. 电力科学与工程. 2018(12)
[2]基于孤立森林算法的用电数据异常检测研究[J]. 余翔,陈国洪,李霆,陈珺. 信息技术. 2018(12)
[3]一种基于Spark模型的电力异常数据检测方法[J]. 朱昌敏,岳东. 计算机技术与发展. 2019(01)
[4]基于Isolation Forest改进的数据异常检测方法[J]. 徐东,王岩俊,孟宇龙,张子迎. 计算机科学. 2018(10)
[5]基于信息筛选和拉依达准则识别地下水主要组分水化学异常的方法研究[J]. 王磊,何江涛,张振国,赵鹏,张小文. 环境科学学报. 2018(03)
[6]数据缺失下的贝叶斯网络应用研究[J]. 陈亚奇. 信息系统工程. 2017(07)
[7]基于归一化互信息的FCBF特征选择算法[J]. 段宏湘,张秋余,张墨逸. 华中科技大学学报(自然科学版). 2017(01)
[8]基于AIC准则的锂离子电池变阶RC等效电路模型研究[J]. 商云龙,张奇,崔纳新,张承慧. 电工技术学报. 2015(17)
[9]基于Hadoop框架和ARIMA算法的气象预测系统研究[J]. 李雷孝,马志强,樊宇虹,赵岩. 内蒙古师范大学学报(自然科学汉文版). 2014(02)
[10]基于正弦曲线的数字化变电站采样值数据缺失的修正方法[J]. 尹建丰,施爱博,季海涛,朱佳伟. 自动化与仪器仪表. 2014(01)
博士论文
[1]数据归约的统计方法研究及应用[D]. 刘云霞.厦门大学 2007
硕士论文
[1]海量电能质量数据的实时存储与治理技术研究[D]. 王嘉怡.北方工业大学 2018
[2]风电场风速及风电功率短期预测方法的研究[D]. 李俊豪.河北工业大学 2012
本文编号:3213172
【文章来源】:北方工业大学北京市
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
图1-4量测指标编码结构示意图??-
用于监察生产过程是否产生异常以及过程是否受控。控制图上通常有三条控制线:??中心线(统计样本的平均值)、上控制线和下控制线(上下控制线与中心线相距??数倍标准差),并有按顺序抽取的样本描点序列,如图2-1所示。若控制图中的??描点落在上控制线与下控制线之外或描点在控制线之间的排列不随机,则表明过??程异常。??VCL????CL?___/_??LCL??i?l?i?I?i?i?i?I??1?2?3?4?5?6?78??图2-1控制图示例??控制图可分为两类,一类是计量值控制图,通常用于观察样本数值分布的变??化,;一类是计数型控制图,主要用于发现生产过程中的异常,控制生产的过程。??常见的计量值控制图有均值-极差控制图、均值-标准差控制图、单值-极差控??制图等。??均值图(I)具有适用范围广,灵敏度高的特点,若X服从正态分布,则又-也??服从正态分布;若X非正态分布,当样本量充分大时,1近似服从正态分布[29]。??均值-标准差图由均值(又)图和标准差(S)图共同组成。与又-R图相对应,又图??主要用来判断生产过程的均值是否稳定;S图用来判断生产过程标准差的稳定程??度。依照习惯把X图列在上方,而把S图列在下方。一般来说,组中样本量大于??14??
互信息计算过程如下:??数据中获取所有监测指标的数据,根据采样周期,对比应收实收数据量CountAcu,如果CourrtRec=CountAcu,则该监测则该指标存在数据缺失。存在数据缺失的指标为待测指标,样周期一致的指标作为待选指标。一一选取待选指标的监测待测指标的监测数据重组排序形成数据集,使用式2-4对数的计算,为了更好地对互信息进行比较,消除数据量带来的一化为归一化互信息NMI。选择归一化互信息NMI最大且N作为相关指标。??分析??量相关性的归一化互信息,通过实验验证归一化互信息对电相关性的可行性与结果的准确性。本实验选取5个小时的数果相关系数进行比较。??能质量监测数据是由监测点,监测指标,时间戳以及监测值
【参考文献】:
期刊论文
[1]一种基于k-means的两阶段用电异常检测方法[J]. 张铁峰,张靖. 电力科学与工程. 2018(12)
[2]基于孤立森林算法的用电数据异常检测研究[J]. 余翔,陈国洪,李霆,陈珺. 信息技术. 2018(12)
[3]一种基于Spark模型的电力异常数据检测方法[J]. 朱昌敏,岳东. 计算机技术与发展. 2019(01)
[4]基于Isolation Forest改进的数据异常检测方法[J]. 徐东,王岩俊,孟宇龙,张子迎. 计算机科学. 2018(10)
[5]基于信息筛选和拉依达准则识别地下水主要组分水化学异常的方法研究[J]. 王磊,何江涛,张振国,赵鹏,张小文. 环境科学学报. 2018(03)
[6]数据缺失下的贝叶斯网络应用研究[J]. 陈亚奇. 信息系统工程. 2017(07)
[7]基于归一化互信息的FCBF特征选择算法[J]. 段宏湘,张秋余,张墨逸. 华中科技大学学报(自然科学版). 2017(01)
[8]基于AIC准则的锂离子电池变阶RC等效电路模型研究[J]. 商云龙,张奇,崔纳新,张承慧. 电工技术学报. 2015(17)
[9]基于Hadoop框架和ARIMA算法的气象预测系统研究[J]. 李雷孝,马志强,樊宇虹,赵岩. 内蒙古师范大学学报(自然科学汉文版). 2014(02)
[10]基于正弦曲线的数字化变电站采样值数据缺失的修正方法[J]. 尹建丰,施爱博,季海涛,朱佳伟. 自动化与仪器仪表. 2014(01)
博士论文
[1]数据归约的统计方法研究及应用[D]. 刘云霞.厦门大学 2007
硕士论文
[1]海量电能质量数据的实时存储与治理技术研究[D]. 王嘉怡.北方工业大学 2018
[2]风电场风速及风电功率短期预测方法的研究[D]. 李俊豪.河北工业大学 2012
本文编号:3213172
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3213172.html