电力中文文本数据挖掘技术及其在可靠性中的应用研究

发布时间:2018-09-04 08:09
【摘要】:随着电网智能化与信息化的建设,电网企业积累了大量的数据,逐渐构成了学术界和工业界共同关注的电力大数据。本文将电力系统全生产过程、电力设备全寿命过程中产生的数据,统称为全寿命数据,其类型涵盖了结构化和非结构化数据。目前在电力领域中,主要侧重于结构化数据挖掘的研究,也有针对图像识别的研究,但是,电力文本挖掘研究才刚刚起步。本文以获取可靠性的相关指标(统计指标、健康指数、广义故障率和可靠性)为目的,以电力设备资产管理为着眼点,重点对电力文本挖掘及多源数据的融合技术进行了深入研究,取得了如下成果。1.针对可靠性和资产管理的特点,给出了电网自然语言处理(Natural language processing for power grids,NLP4PG)的基础定义。编撰了专业词典、变压器本体词典和领域语料库,并将部分内容开源共享。融合了本体论与电力领域知识,建立了适用于NLP4PG的总框架。指出了NLP4PG的工作原理和潜在应用,并分析了若干语言特性和语言模型,填补了电力中文文本挖掘研究的空白。2.基于语义框架思想,将离线统计学习与在线语义规则的方法相结合,提出了适用于故障与缺陷分类统计的文本挖掘模型。解决了缺陷文本句子成分难以划分、数字量无法精确提取等问题,并实现了本体字典的半自动化构建技术。3.针对设备健康指数(Health Index)多源、多类型的特点,改进了kNN算法,提出了具备自主区间寻优能力的电力缺陷短文本分类模型。该模型实现了从故障缺陷文本到HI的自学习映射,能够在最大程度上挖掘同类设备的相似信息、融合同台设备的历史信息,使得HI更加合理、精准。在一定程度上,改变了运维人员主观评价故障/缺陷等级的方式,并符合电网企业精细化管理的发展要求。4.为了能够充分利用从全寿命数据中挖掘到的亚健康状态信息,同时处理多类型复发事件,提出了基于鞅过程和非参数理论的设备故障率预测模型。该理念完全区别于以往单一变量的故障率模型(基于时间或状态量的定参数分布函数),通过算例结果、鞅残差检验、灵敏度分析表明,该模型能够定量地、精确地描绘短期故障率,为剩余寿命预测、状态检修优化提供基础可靠性指标。5.针对智能变电站自动化系统(Smart Substation Automation System,SSAS)这类新型的、缺乏运维数据的场景,提出了基于网络层次分析法的广义可靠性评估模型。参考IEC 61850标准、设计文档和相关文献,构建了SSAS本体平台,包括物理本体、逻辑本体和信息流本体。对应地,将系统可靠性作为总指标,涵盖了物理可靠性、逻辑可靠性、信息流可靠性和系统经济性。四大指标下面包含了若干定量与定性的指标。通过算例结果与灵敏度分析表明,在缺乏运维数据的情况下,本模型能够用于新型系统的可靠性评估,为设计方案的遴选提供一种新思路。
[Abstract]:With the construction of intelligent and information power grid, power grid enterprises have accumulated a large amount of data, which has gradually become the common concern of the academic and industrial power big data. In this paper, the data generated in the whole production process of power system and in the whole life process of power equipment are referred to as the whole life data. The types of data include structured and unstructured data. At present, the research on structured data mining and image recognition is mainly focused on in the field of electric power. However, the research of power text mining is only in its infancy. The purpose of this paper is to obtain reliability related indicators (statistical index, health index, generalized failure rate and reliability), and to focus on the management of power equipment assets. The technology of power text mining and multi-source data fusion is studied in detail, and the following results are obtained. 1. According to the characteristics of reliability and asset management, the basic definition of natural language processing (Natural language processing for power grids,NLP4PG) of power grid is given. Professional dictionaries, transformer ontology dictionaries and domain corpus are compiled, and some contents are shared open source. The ontology and power domain knowledge are combined, and the general framework for NLP4PG is established. The working principle and potential application of NLP4PG are pointed out, and some language characteristics and language models are analyzed. Based on the idea of semantic framework, a text mining model for fault and defect classification statistics is proposed by combining offline statistical learning with online semantic rules. It solves the problem that it is difficult to divide the sentence components of the defective text, and the digital quantity can not be extracted accurately, and realizes the semi-automatic construction technology of ontology dictionary .3. In view of the multi-source and multi-type characteristics of equipment health index (Health Index), an improved kNN algorithm is proposed, and a power defect short text classification model with autonomous interval optimization ability is proposed. The model realizes the self-learning mapping from fault defect text to HI. It can mine the similar information of the same equipment to the maximum extent and fuse the historical information of the same equipment, making the HI more reasonable and accurate. To a certain extent, it changes the way of subjective evaluation of fault / defect grade by operation and maintenance personnel, and meets the development requirement of fine management of power grid enterprises. In order to make full use of the sub-health state information mined from the whole life data and to deal with multiple recurrence events at the same time, a prediction model of equipment failure rate based on martingale process and non-parametric theory is proposed. The idea is completely different from the failure rate model of single variable (the fixed parameter distribution function based on time or state quantity). The results of example, martingale residuals test and sensitivity analysis show that the model can be used quantitatively. Describe the short-term failure rate accurately and provide basic reliability index. 5. 5 for residual life prediction and condition-based maintenance optimization. Aiming at the new situation of intelligent substation automation system (Smart Substation Automation System,SSAS), which lacks the operational data, a generalized reliability evaluation model based on the analytic hierarchy process (AHP) is proposed. Referring to IEC 61850 standard, design documents and related documents, the SSAS ontology platform is constructed, including physical ontology, logical ontology and information flow ontology. Correspondingly, the reliability of the system is taken as the total index, which covers physical reliability, logic reliability, information flow reliability and system economy. The four indicators contain a number of quantitative and qualitative indicators. The results of numerical examples and sensitivity analysis show that the model can be used to evaluate the reliability of the new system without operational and maintenance data and provide a new idea for the selection of design scheme.
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TM732;TP391.1

【相似文献】

相关期刊论文 前10条

1 张寿锋;新加坡电力欲拓展全球市场[J];发电设备;2000年03期

2 ;法国将部分开放电力市场[J];华北电业;2000年03期

3 程慈源;电力市场浅谈[J];山东电力技术;2000年02期

4 吴天明;日本开放电力市场[J];大众用电;2000年05期

5 杜松怀;美国加州电力危机对电力市场改革的影响[J];农村电气化;2001年07期

6 ;法国建立电力交易所[J];电力需求侧管理;2001年04期

7 ;法国将部分开放电力市场[J];华北电业;2001年03期

8 吴锡荣;开拓电力检修的新天地[J];中国电力企业管理;2001年11期

9 ;中国电力下期要目[J];中国电力;2002年06期

10 ;电力市场的基本特征和基本原则[J];广西电业;2002年04期

相关会议论文 前10条

1 戴铁潮;;美国加州电力市场危机的思考[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年

2 杨宽宽;;电力如何先行[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年

3 马爱杰;刘钧;益彬;;全国电力供需紧缺 江苏多措化解困境[A];江苏省能源研究会成立二十周年纪念暨第十届学术年会热电专委会第十二届年会暨学术报告会论文集[C];2004年

4 钱云;;加快电力发展 全面建设小康社会[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上)[C];2003年

5 王大光;李虎军;;电力市场中的福建水电探讨[A];福建省科学技术协会第七届学术年会分会场——提高水力发电技术 促进海西经济建设研讨会论文集[C];2007年

6 肖军;;保障电力系统安全前提下的电力市场发展[A];全国火电大机组(300MW级)竞赛第38届年会论文集[C];2009年

7 ;国家电监会2012年工作会议召开,李克强对电力监管工作作出重要批示[A];《电站信息》2012年第2期[C];2012年

8 高志华;任震;黄福全;朱然;;省级电力市场竞标及结算模式研究[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年

9 陈宝健;;学习广东经验 加快贺州电力发展[A];广西水利厅厅庆征文选集(2)[C];2004年

10 刘钧;益彬;;全国电力供需紧缺 江苏多措化解困境[A];首届长三角科技论坛——能源科技分论坛论文集[C];2004年

相关重要报纸文章 前10条

1 艾闻;新加坡创建竞争性电力市场[N];中国电力报;2002年

2 周渝慧;政府在电力市场中的定位[N];华中电力报;2005年

3 记者冉永平;规范电力市场秩序保证电力供应[N];人民日报;2003年

4 段炼;电力监管的重要手段[N];中国电力报;2006年

5 董筱宇;电力监管报告制度化[N];中国工业报;2007年

6 本报记者 衣大鹏;电力酒:细分营销谋取新突破[N];华夏酒报;2010年

7 本报评论员;民资涉电期待更多扶持[N];中国电力报;2012年

8 本报记者 史爱萍;电力租赁:企业降本增效新途径[N];中国有色金属报;2012年

9 本报记者 段贵恒;首个支持民资进入电力市场办法出台[N];中国电力报;2012年

10 本报记者 刘文硕;坚持电力统一规划 转变电力发展方式[N];国家电网报;2013年

相关博士学位论文 前10条

1 徐燕;制度—政策—技术交互下的电力转型理论与规划方法研究[D];华北电力大学(北京);2016年

2 邱剑;电力中文文本数据挖掘技术及其在可靠性中的应用研究[D];浙江大学;2016年

3 朱治中;电力市场及其制度研究[D];中国电力科学研究院;2005年

4 郭明星;我国电力市场产出波动与宏观经济波动的关联性研究[D];吉林大学;2006年

5 吕连宏;广东省电力生态系统分析与调控研究[D];北京林业大学;2012年

6 曹毅刚;竞争性电力市场中的金融工程理论与实证研究[D];天津大学;2008年

7 张启平;电力市场竞争性均衡理论及其算法研究[D];上海交通大学;2008年

8 褚景春;基于需求侧参与的竞争性电力市场理论及应用研究[D];华北电力大学(北京);2011年

9 华栋;电力市场交易机制的实验研究[D];华南理工大学;2012年

10 杨彦;基于博弈论的考虑输电网络约束电力市场均衡分析[D];华南理工大学;2011年

相关硕士学位论文 前10条

1 刘奇洋;安康供电分公司生产调度楼设计研究[D];西安建筑科技大学;2015年

2 牛贞贞;典型电力用户需求响应分析研究[D];郑州大学;2015年

3 何玉磊;H发电公司发展战略研究[D];山东大学;2015年

4 孙啸;中成股份投资孟加拉国电力市场拓展策略研究[D];对外经济贸易大学;2015年

5 白莹;蒙东地区农网储能系统项目建设及实施效果评价研究[D];华北电力大学;2015年

6 程可;基于多智能体的电力市场竞价行为研究[D];华北电力大学;2015年

7 谢鸣;考虑电动汽车和风力发电的电力市场均衡分析[D];上海大学;2015年

8 杜星辰;晋中市电网多阶段规划研究[D];华北电力大学;2015年

9 柴玉凤;重要电力用户供用电风险指标优化及评估模型研究[D];华北电力大学;2015年

10 伍国豪;中国电力监管行政问责制研究[D];兰州大学;2015年



本文编号:2221506

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2221506.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c6de2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com