基于文本挖掘的道岔故障分类研究
本文关键词:基于文本挖掘的道岔故障分类研究
更多相关文章: 道岔 故障 文本挖掘 文本分类 主题模型 支持向量机
【摘要】:随着铁路运输高速发展,铁路运输对铁路信号系统的要求不断提高,随之对铁路信号系统设备维护效率要求也越来越高。道岔是铁路信号系统中的重要基础设备,是铁路保持高效运输的关键设备,也是电务维护的重点。铁路电务工作人员投入大量的精力对道岔进行维护,但道岔仍然是故障的高发部位。因此,开展对道岔故障的分类研究,提高道岔故障维护效率,具有重要意义。道岔在运营维护过程中,积累了大量的维护数据,并以文本的方式记录。这些维护数据对道岔故障分析和设备维护决策有重大的参考价值。通过统计研究广州铁路(集团)公司(简称广铁集团)现场的故障一览表可发现:故障数据录入缺乏规范性,导致故障数据可利用价值降低;故障表中设备类别设置不合理,对故障数据的统计和处理带来一定的难度。铁路信号设备维护管理者希望通过制定一些规章制度解决这类问题,但效果并不理想。针对上述问题,本文进行了如下研究:根据道岔设备结构组成与工作原理,结合道岔故障记录数据,将道岔故障设备类别进行了重新设置:应用文本挖掘的方法,设计了道岔故障分类器,实现了对道岔故障的自动分类;利用重新设置的道岔故障设备类别和设计的道岔故障分类器,设计并实现了道岔故障数据录入表单,通过设计的表单对道岔故障数据实时记录,确保数据记录准确有效。本文具体研究工作及成果如下:(1)分析了道岔的结构组成和工作原理。将道岔的分析与故障一览表中记录的道岔故障数据相结合,对道岔故障进行合理的分类。(2)提取了道岔故障数据中的专业术语,将提取的专业术语注入NLPIR汉语分词系统(又名ICTCLA)的用户词典中,对道岔故障文本进行了分词处理。(3)针对道岔故障数据描述的多样化,应用了PLSA主题模型特征提取方法对故障文本进行特征提取。(4)应用了支持向量机的方法设计道岔故障分类器,实现了道岔故障设备类别自动分类,并将分类效果与其他分类方法进行了对比。对比结果表明,PLSA主题模型特征提取与支持向量机相结合的分类效果相对优于其他分类方法。(5)根据道岔故障分类结果并结合现场需求,设计并实现了道岔故障数据录入表单,规范了道岔故障数据录入。本文通过对道岔的分类研究和道岔故障录入表单的设计,增强了数据录入的规范性,保证了故障数据录入的有效性,提高了道岔维护管理的效率。
【关键词】:道岔 故障 文本挖掘 文本分类 主题模型 支持向量机
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:U216.425;TP391.1
【目录】:
- 致谢5-6
- 摘要6-8
- ABSTRACT8-12
- 1 引言12-20
- 1.1 论文选题背景与意义12-14
- 1.2 国内外研究现状14-18
- 1.2.1 设备维护管理信息化概述14-17
- 1.2.2 文本挖掘简介17-18
- 1.3 论文主要工作内容及组织架构18-19
- 1.4 本章小结19-20
- 2 预备知识20-33
- 2.1 文本挖掘中的文本分类20-27
- 2.1.1 文本预处理21
- 2.1.2 特征降维和特征权重方法21-24
- 2.1.3 分类器设计算法24-27
- 2.1.4 分类性能评估27
- 2.2 道岔结构组成及维护管理27-32
- 2.2.1 道岔结构组成27-29
- 2.2.2 转辙机29-32
- 2.2.3 道岔维护管理32
- 2.3 本章小结32-33
- 3 道岔故障分类及文本预处理33-40
- 3.1 道岔故障文本数据简介33-34
- 3.2 道岔故障分类流程34-35
- 3.3 道岔故障分类文本预处理35-39
- 3.3.1 道岔故障类别标签设定35-37
- 3.3.2 文本分词37-39
- 3.3.3 去停用词39
- 3.4 本章小结39-40
- 4 基于主题模型的道岔故障特征提取40-48
- 4.1 PLSA主题模型特征提取40-42
- 4.1.1 主题模型表示41
- 4.1.2 模型参数估计41-42
- 4.1.3 新样本模型表示42
- 4.2 道岔故障描述分析42-44
- 4.3 道岔故障特征提取44-47
- 4.4 本章小结47-48
- 5 基于支持向量机的道岔故障分类48-60
- 5.1 支持向量机48-50
- 5.2 分类器应用50-51
- 5.3 分类结果评价方法51-53
- 5.4 分类结果分析53-59
- 5.5 本章小结59-60
- 6 道岔故障数据录入表单的设计与实现60-69
- 6.1 道岔故障数据录入表单设计60-62
- 6.2 道岔故障数据录入表单实现62-68
- 6.2.1 电务调度指挥中心系统简介62-65
- 6.2.2 动态表单实现65-68
- 6.3 本章小结68-69
- 7 总结及展望69-71
- 参考文献71-73
- 图索引73-74
- 表索引74-75
- 作者简历及攻读硕士学位期间取得的研究成果75-77
- 学位论文数据集77
【相似文献】
中国期刊全文数据库 前10条
1 张燕;寒枫;楚红涛;;文本挖掘简述[J];中国电力教育;2006年S3期
2 龚乐君;韦有兵;谢建明;袁志栋;孙啸;;一种面向基因与疾病关系的文本挖掘方法[J];东南大学学报(自然科学版);2010年03期
3 胥桂仙,许建潮,连远锋,李昱翠;文本挖掘中的特征表示及聚类方法[J];吉林工学院学报(自然科学版);2002年03期
4 林鸿飞,战学刚,姚天顺;中文文本挖掘的特征导航机制[J];东北大学学报;2000年03期
5 胥桂仙,苏筱蔚,陈淑艳;中文文本挖掘中的无词典分词的算法及其应用[J];吉林工学院学报(自然科学版);2002年01期
6 李湘云;;ISODATA动态聚类算法在文本挖掘中的应用[J];长春工程学院学报(自然科学版);2007年02期
7 朱蔷蔷;张桂芸;刘文龙;;基于MapReduce框架一种文本挖掘算法的设计与实现[J];郑州大学学报(工学版);2012年05期
8 张黎黎;;Web文本挖掘在智能分类中的应用[J];山东工业技术;2013年11期
9 张涛;邓军;;现代远程教育个性化Web挖掘研究[J];科学技术与工程;2007年05期
10 白翎雁;才书训;;Web文本挖掘及相关技术研究[J];沈阳工程学院学报(自然科学版);2008年03期
中国重要会议论文全文数据库 前10条
1 陈林;王晓华;李殿峗;文俊浩;;基于自增模式的文本挖掘研究[A];’2004计算机应用技术交流会议论文集[C];2004年
2 王巍;杨武;张乐君;郑军;;支持网络话题管理的文本挖掘算法分析[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
3 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
4 高飞;荆继武;向继;;文本挖掘系统的可视化方法研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
5 朱强生;田英;周延泉;何华灿;;基于非负因子分析的模糊文本挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
6 钱程扬;龙毅;徐震;孙昊;;基于Web文本挖掘的地理位置信息重建技术[A];中国地理学会2007年学术年会论文摘要集[C];2007年
7 蒋子海;周斌;吴泉源;;基于UIMA AS的文本挖掘系统的性能分析与评估[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
8 邱晓蕾;张聪超;;基于SVD和部分聚集分类的文本挖掘算法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
10 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
中国重要报纸全文数据库 前4条
1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
3 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
4 ;用挖掘技术使学术资源利用效益最大化[N];中国计算机报;2007年
中国博士学位论文全文数据库 前10条
1 曹奇敏;网络信息文本挖掘若干问题研究[D];北京理工大学;2015年
2 陈虹枢;基于主题模型的专利文本挖掘方法及应用研究[D];北京理工大学;2015年
3 李梅;文本挖掘中若干关键技术研究[D];西北农林科技大学;2016年
4 袁锋;中医医案文本挖掘的若干关键技术研究[D];山东师范大学;2016年
5 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
6 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
7 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
8 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年
9 文翰;面向信息检索的Web文本挖掘方法研究[D];华南理工大学;2012年
10 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
中国硕士学位论文全文数据库 前10条
1 张馨允;基于Spark的Web文本挖掘系统的研究与实现[D];吉林大学;2016年
2 王钊;基于Hadoop的文本挖掘研究与应用[D];广东工业大学;2016年
3 黄建澍;面向人大代表议案处理的文本挖掘系统的设计与实现[D];中国科学院大学(工程管理与信息技术学院);2016年
4 徐奇钊;基于文本挖掘的文本情绪分类[D];云南财经大学;2016年
5 邹运怀;基于文本挖掘的道岔故障分类研究[D];北京交通大学;2016年
6 王萍;基于Web文本挖掘的电子商务专业人才市场需求研究[D];重庆工商大学;2016年
7 盛华;聚类分析在文本挖掘中的应用与研究[D];江南大学;2016年
8 刘超;业界专家的媒体发言对公司股价影响的分析[D];上海师范大学;2016年
9 吴亚宇;基于文本挖掘的年报情感与上市公司业绩的关系研究[D];中国地质大学(北京);2016年
10 高希瑞;基于文本挖掘的企业危机预警研究[D];华东师范大学;2011年
,本文编号:857414
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/857414.html