风机集群大数据分析平台设计与实现
发布时间:2021-01-15 00:41
近年来随着化石能源短缺和环境污染加剧,世界各国日益重视可再生能源的开发和利用。风力发电以其清洁、安全、储能丰富的优势,近年来取得了快速发展。随着我国能源结构转型,风能也将在我国能源结构中发挥越来越重要的作用。因此对风电生产问题进行深入研究具有重要意义。然而,目前风力发电企业仍采用传统的数据库技术、数据处理技术来开展大数据的分析研究。由于缺乏专用技术及工具的支持,数据处理的时效性、可用性不强,对于数据的分析还停留在初级阶段,缺乏深层次的数据挖掘。为了解决当前风电行业数据分析处理响应慢、实时性低、难以处理高维、属性复杂数据等问题,本文设计开发了风机集群大数据分析平台。本文的主要内容如下:(1)论文对风机集群大数据分析平台进行了需求分析,基于微服务思想设计了平台的系统架构和技术架构,完成了平台功能模块的划分和模块间通信方式的设计。(2)针对风力发电数据存在的数据丢失、数据异常等问题,论文采用k-近邻算法完成了缺失数据的填补,采用孤立森林算法对异常数据进行了检测,并通过实例验证了算法的有效性和准确性,同时实现了风力发电数据的归一化处理。(3)基于Spark Streaming实现了BP神经网络...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:99 页
【学位级别】:硕士
【部分图文】:
缺失率对最佳k值的影响
西安电子科技大学硕士学位论文26图3.3 填补效果对比从图 3.3 中可以看出,当缺失率较小时,k-近邻填补、均值填补、回归填补、EM算法均具有较好的填补效果,当缺失率增加时,四种算法的均方根误差均随之增加,可见,数据缺失率影响着算法的填补效果。在此情况下 k-近邻算法 RMSE 值依然低于均值填补、回归填补和 EM 算法填补。通过以上实验可知,在缺失率低于 10%时,k-近邻算法对缺失数据的填补表现良好且很稳定,能够满足使用要求。3.3 风力发电异常数据检测方法研究现实生产中,数据测量误差、采集记录错误、通信传输干扰以及偶然工况等都会致使数据污染
风力发电机组风速-功率散点图
本文编号:2977872
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:99 页
【学位级别】:硕士
【部分图文】:
缺失率对最佳k值的影响
西安电子科技大学硕士学位论文26图3.3 填补效果对比从图 3.3 中可以看出,当缺失率较小时,k-近邻填补、均值填补、回归填补、EM算法均具有较好的填补效果,当缺失率增加时,四种算法的均方根误差均随之增加,可见,数据缺失率影响着算法的填补效果。在此情况下 k-近邻算法 RMSE 值依然低于均值填补、回归填补和 EM 算法填补。通过以上实验可知,在缺失率低于 10%时,k-近邻算法对缺失数据的填补表现良好且很稳定,能够满足使用要求。3.3 风力发电异常数据检测方法研究现实生产中,数据测量误差、采集记录错误、通信传输干扰以及偶然工况等都会致使数据污染
风力发电机组风速-功率散点图
本文编号:2977872
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2977872.html