风机集群大数据分析平台设计与实现

发布时间：2021-01-15 00:41

　　近年来随着化石能源短缺和环境污染加剧,世界各国日益重视可再生能源的开发和利用。风力发电以其清洁、安全、储能丰富的优势,近年来取得了快速发展。随着我国能源结构转型,风能也将在我国能源结构中发挥越来越重要的作用。因此对风电生产问题进行深入研究具有重要意义。然而,目前风力发电企业仍采用传统的数据库技术、数据处理技术来开展大数据的分析研究。由于缺乏专用技术及工具的支持,数据处理的时效性、可用性不强,对于数据的分析还停留在初级阶段,缺乏深层次的数据挖掘。为了解决当前风电行业数据分析处理响应慢、实时性低、难以处理高维、属性复杂数据等问题,本文设计开发了风机集群大数据分析平台。本文的主要内容如下:（1）论文对风机集群大数据分析平台进行了需求分析,基于微服务思想设计了平台的系统架构和技术架构,完成了平台功能模块的划分和模块间通信方式的设计。（2）针对风力发电数据存在的数据丢失、数据异常等问题,论文采用k-近邻算法完成了缺失数据的填补,采用孤立森林算法对异常数据进行了检测,并通过实例验证了算法的有效性和准确性,同时实现了风力发电数据的归一化处理。（3）基于Spark Streaming实现了BP神经网络...

【文章来源】：西安电子科技大学陕西省 211工程院校教育部直属院校

【文章页数】：99 页

【学位级别】：硕士

【部分图文】：

风机集群大数据分析平台设计与实现

缺失率对最佳k值的影响

缺失率,近邻算法,均值,缺失数据

西安电子科技大学硕士学位论文26图3.3 填补效果对比从图 3.3 中可以看出，当缺失率较小时，k-近邻填补、均值填补、回归填补、EM算法均具有较好的填补效果，当缺失率增加时，四种算法的均方根误差均随之增加，可见，数据缺失率影响着算法的填补效果。在此情况下 k-近邻算法 RMSE 值依然低于均值填补、回归填补和 EM 算法填补。通过以上实验可知，在缺失率低于 10%时，k-近邻算法对缺失数据的填补表现良好且很稳定，能够满足使用要求。3.3 风力发电异常数据检测方法研究现实生产中，数据测量误差、采集记录错误、通信传输干扰以及偶然工况等都会致使数据污染

散点图,风力发电机组,散点图,功率

风力发电机组风速-功率散点图

本文编号：2977872

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2977872.html

上一篇：基于J2EE的卷烟设备维护管理系统的设计与实现
下一篇：基于FPGA的高效数据过滤技术研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|