基于文本挖掘技术的电力设备缺陷分析
发布时间:2021-02-13 08:52
电力设备在运行过程中会出现各种缺陷,这些缺陷若不及时发现并消除,会危及电力系统的运行安全;为了提高缺陷诊断和消除的准确性,有必要深入分析影响电力设备缺陷发生的因素以及缺陷发生的规律。目前电力设备缺陷详细情况往往以文本形式描述,人工分析统计工作量大,并且会由于知识和经验的差异,导致分析不准确,因此迫切需要计算机自动进行文本挖掘,从缺陷描述文本中提取出关键信息,实现电力设备缺陷精细化分析与统计。本文的研究工作主要针对电力设备缺陷文本,研究文本挖掘技术,实现电力设备缺陷的精细化分析。本文的主要研究内容包括:1.分析了电力设备缺陷文本的预处理技术。首先分析了电力设备缺陷文本的特点,指出缺陷文本包括结构化信息和非结构化信息,本文的挖掘对象是非结构部分,即缺陷的详细描述;然后介绍了缺陷文本的预处理技术,包括缺陷文本分词技术和本体词典构建技术,以及去停用词的方法;接着简单介绍了常用的文本表示方法,包括向量化表示模型、树/图结构模型;最后提出了基于知识图谱技术的缺陷文本质量分析方法以及检索查错流程,为后续文本挖掘提供质量有保证的文本。2.提出了基于语义框架的电力设备缺陷文本挖掘方法。经过对大量缺陷文本...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
语义框架构建最近
浙江大学硕士学位论文第三章基于语义框架的电力设备缺陷文本挖掘方法27入缺陷文本有效性的自检。3.3.2批量缺陷文本的挖掘结果按上述过程对1616条变压器缺陷记录进行了文本挖掘,为验证挖掘结果的正确性,采用人工核查方式进行了检查,发现准确率大约在75%~80%之间。准确率之所以是个区间,是由于核查人员经验不同,核查难以做到标准化。对挖掘不准确的文本进行研究,发现主要是包含“后台类信息”在内的较长文本,这些文本的语法规则相对不规范,导致正确率下降。对于短小精悍的缺陷文本,准确率可达到90%以上。此外,核查发现文本的数量和质量较大地影响着挖掘的准确率。以数量为例,通常会认为电力企业应该拥有大量的样本,而客观上由于电力设备的高可靠性以及信息管理系统建设历史不长,缺陷文本在数量上还需积累。但是上述准确率已能表明所提出的文本挖掘方法是可行有效的,相信随着样本增加、文本质量提高以及本体字典的完善,准确率会进一步提高。下面举例说明根据1616条缺陷记录的挖掘结果实现的各类统计。1)统计该电网十年间变压器有载分接开关的缺陷种类与数量,结果如图3-6所示。图3-6有载分接开关缺陷种类与数量的关系其中,横坐标为基于国标的有载分接开关九大类缺陷,1-9分别代表:1绝缘性能,2直流电阻,3抗短路能力,4温度,5油性能,6老化,7机械特性,8外观,9通信;纵坐标代表相应缺陷发生的次数。例如,“绝缘性能”为54,表示该电网变压器有载分接开关发生54次绝缘性能缺陷;“油性能”缺陷数最多,
浙江大学硕士学位论文第三章基于语义框架的电力设备缺陷文本挖掘方法28有183次,说明有载分接开关的“油性能”容易出现缺陷。2)统计该电网十年间变压器七大部件的缺陷数量情况,结果如图3-7所示。其中,部件1-7分别代表:1保护系统,2有载分接开关,3后台,4冷却器,5器身,6绕组,7套管;缺陷类型1-9同图3-6。由此可见,该电网的变压器器身发生油性能类型的缺陷最多。图3-7十年间七大部件的缺陷数量图3)统计该电网2013年一年变压器七大部件的缺陷数量情况,结果如图3-8所示。比较图3-7与图3-8可以发现,该年份的缺陷分布与十年间的缺陷分布有较大相似度,但后台系统通信缺陷的数量有增多。图3-82013年变压器七大部件的缺陷数量图4)统计该电网十年间变压器缺陷数量的变电站分布情况,结果如图3-9所示。其中,缺陷数量以变电站为单位进行统计,图中的一个柱子代表一个变电站,由此可见,其中一个变电站的缺陷数量明显偏高。
【参考文献】:
期刊论文
[1]电网设备缺陷文本的质量评价与提升方法[J]. 邵冠宇,王慧芳,何奔腾. 电网技术. 2019(04)
[2]基于知识图谱技术的电力设备缺陷记录检索方法[J]. 刘梓权,王慧芳. 电力系统自动化. 2018(14)
[3]基于文本挖掘方法的突发事件与医学救援装备关联研究[J]. 周亮,胡坤鹏,唐硕,张平,张治钢,范立冬,肖南,李曙光. 中国医疗设备. 2018(03)
[4]大数据技术在配电网中的应用综述[J]. 费思源. 中国电机工程学报. 2018(01)
[5]基于卷积神经网络的电力设备缺陷文本分类模型研究[J]. 刘梓权,王慧芳,曹靖,邱剑. 电网技术. 2018(02)
[6]微博文本挖掘研究综述[J]. 余容,李光强,尹健. 情报探索. 2017(05)
[7]超高压输变电设备缺陷统计与分析处理[J]. 张小平,薄鲁海,吴冬文. 电工文摘. 2016(02)
[8]文本信息挖掘技术及其在断路器全寿命状态评价中的应用[J]. 邱剑,王慧芳,应高亮,张波,邹国平,何奔腾. 电力系统自动化. 2016(06)
[9]大能源思维与大数据思维的融合(一)大数据与电力大数据[J]. 薛禹胜,赖业宁. 电力系统自动化. 2016(01)
[10]在配电网中应用大数据的机遇与挑战[J]. 苗新,张东霞,孙德栋. 电网技术. 2015(11)
博士论文
[1]电力中文文本数据挖掘技术及其在可靠性中的应用研究[D]. 邱剑.浙江大学 2016
[2]基于潜在语义分析的中文概念检索研究[D]. 刘云峰.华中科技大学 2005
硕士论文
[1]基于生物医学文本挖掘的蛋白质间相互作用关系抽取方法的研究[D]. 包振栋.西北农林科技大学 2017
[2]基于文本分类技术的垃圾邮件过滤研究[D]. 张小花.安徽大学 2017
[3]基于信息抽取的语义框架填充技术研究[D]. 白晓雷.河南科技大学 2014
[4]基于本体的智能电网知识检索系统[D]. 李洋.北京理工大学 2011
本文编号:3032277
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
语义框架构建最近
浙江大学硕士学位论文第三章基于语义框架的电力设备缺陷文本挖掘方法27入缺陷文本有效性的自检。3.3.2批量缺陷文本的挖掘结果按上述过程对1616条变压器缺陷记录进行了文本挖掘,为验证挖掘结果的正确性,采用人工核查方式进行了检查,发现准确率大约在75%~80%之间。准确率之所以是个区间,是由于核查人员经验不同,核查难以做到标准化。对挖掘不准确的文本进行研究,发现主要是包含“后台类信息”在内的较长文本,这些文本的语法规则相对不规范,导致正确率下降。对于短小精悍的缺陷文本,准确率可达到90%以上。此外,核查发现文本的数量和质量较大地影响着挖掘的准确率。以数量为例,通常会认为电力企业应该拥有大量的样本,而客观上由于电力设备的高可靠性以及信息管理系统建设历史不长,缺陷文本在数量上还需积累。但是上述准确率已能表明所提出的文本挖掘方法是可行有效的,相信随着样本增加、文本质量提高以及本体字典的完善,准确率会进一步提高。下面举例说明根据1616条缺陷记录的挖掘结果实现的各类统计。1)统计该电网十年间变压器有载分接开关的缺陷种类与数量,结果如图3-6所示。图3-6有载分接开关缺陷种类与数量的关系其中,横坐标为基于国标的有载分接开关九大类缺陷,1-9分别代表:1绝缘性能,2直流电阻,3抗短路能力,4温度,5油性能,6老化,7机械特性,8外观,9通信;纵坐标代表相应缺陷发生的次数。例如,“绝缘性能”为54,表示该电网变压器有载分接开关发生54次绝缘性能缺陷;“油性能”缺陷数最多,
浙江大学硕士学位论文第三章基于语义框架的电力设备缺陷文本挖掘方法28有183次,说明有载分接开关的“油性能”容易出现缺陷。2)统计该电网十年间变压器七大部件的缺陷数量情况,结果如图3-7所示。其中,部件1-7分别代表:1保护系统,2有载分接开关,3后台,4冷却器,5器身,6绕组,7套管;缺陷类型1-9同图3-6。由此可见,该电网的变压器器身发生油性能类型的缺陷最多。图3-7十年间七大部件的缺陷数量图3)统计该电网2013年一年变压器七大部件的缺陷数量情况,结果如图3-8所示。比较图3-7与图3-8可以发现,该年份的缺陷分布与十年间的缺陷分布有较大相似度,但后台系统通信缺陷的数量有增多。图3-82013年变压器七大部件的缺陷数量图4)统计该电网十年间变压器缺陷数量的变电站分布情况,结果如图3-9所示。其中,缺陷数量以变电站为单位进行统计,图中的一个柱子代表一个变电站,由此可见,其中一个变电站的缺陷数量明显偏高。
【参考文献】:
期刊论文
[1]电网设备缺陷文本的质量评价与提升方法[J]. 邵冠宇,王慧芳,何奔腾. 电网技术. 2019(04)
[2]基于知识图谱技术的电力设备缺陷记录检索方法[J]. 刘梓权,王慧芳. 电力系统自动化. 2018(14)
[3]基于文本挖掘方法的突发事件与医学救援装备关联研究[J]. 周亮,胡坤鹏,唐硕,张平,张治钢,范立冬,肖南,李曙光. 中国医疗设备. 2018(03)
[4]大数据技术在配电网中的应用综述[J]. 费思源. 中国电机工程学报. 2018(01)
[5]基于卷积神经网络的电力设备缺陷文本分类模型研究[J]. 刘梓权,王慧芳,曹靖,邱剑. 电网技术. 2018(02)
[6]微博文本挖掘研究综述[J]. 余容,李光强,尹健. 情报探索. 2017(05)
[7]超高压输变电设备缺陷统计与分析处理[J]. 张小平,薄鲁海,吴冬文. 电工文摘. 2016(02)
[8]文本信息挖掘技术及其在断路器全寿命状态评价中的应用[J]. 邱剑,王慧芳,应高亮,张波,邹国平,何奔腾. 电力系统自动化. 2016(06)
[9]大能源思维与大数据思维的融合(一)大数据与电力大数据[J]. 薛禹胜,赖业宁. 电力系统自动化. 2016(01)
[10]在配电网中应用大数据的机遇与挑战[J]. 苗新,张东霞,孙德栋. 电网技术. 2015(11)
博士论文
[1]电力中文文本数据挖掘技术及其在可靠性中的应用研究[D]. 邱剑.浙江大学 2016
[2]基于潜在语义分析的中文概念检索研究[D]. 刘云峰.华中科技大学 2005
硕士论文
[1]基于生物医学文本挖掘的蛋白质间相互作用关系抽取方法的研究[D]. 包振栋.西北农林科技大学 2017
[2]基于文本分类技术的垃圾邮件过滤研究[D]. 张小花.安徽大学 2017
[3]基于信息抽取的语义框架填充技术研究[D]. 白晓雷.河南科技大学 2014
[4]基于本体的智能电网知识检索系统[D]. 李洋.北京理工大学 2011
本文编号:3032277
本文链接:https://www.wllwen.com/kejilunwen/dianlidianqilunwen/3032277.html