动车组质量数据聚类分析研究与应用
本文关键词:动车组质量数据聚类分析研究与应用,由笔耕文化传播整理发布。
【摘要】:动车组零部件质量的好坏将直接影响到动车组的运维效率、运营成本以及运行安全。近年来国内动车组多次出现质量问题,在追溯质量问题根源的时候,我国目前还是采用人工经验排查的方式,这种方式考验相关人员的素质与经验,并且缺少大数据研究作为技术支持,过于主观。另外,在质量问题预测以及有针对性的质量检修工作上,也还处在被动的阶段,没有相应的应对机制。行车状态数据是对零部件质量实时状态的一个真实反映,可以从中发现导致质量异常的因素,动车组数据管理日渐成熟,也已经积累了大量的零部件全生命周期数据,但由于数据量庞大,人工发现数据属性的潜在关系已不可能,因而基于大数据挖掘的质量影响因素的研究变得十分必要。聚类分析将海量数据进行相似性划分,更利于用户进行分析。本文针对数据类型多样、维度高且数据量大等问题,选取Chameleon聚类算法作为研究算法,并对算法在动车组质量数据分析中存在的不足加以改进,提高聚类质量。由于数据量大,传统单机操作满足不了质量问题分析需求,所以对改进后的算法基于Hadoop平台进行并行化实现。本文的主要工作如下:(1)对已有的Chameleon聚类算法做改进,弥补了算法耗费时间以及子簇间密度相差较大影响聚类质量的问题,并通过实验证明改进后算法聚类质量高且速度快。(2)针对动车组质量数据数量庞大的问题,采用Hadoop大数据平台,设计并实现改进后聚类算法的并行化,并通过实验证明基于MapReduce的并行化设计提高了算法效率,能够胜任大数据量的分析工作。(3)对动车组质量数据进行聚类,分析并定位问题根源,另外提出基于履历数据建立质量追溯表,以此为依据实现质量预测工作。本文基于统计学的原理,从海量数据中挖掘出数据属性潜在关系,用以辅助高铁行业实现质量问题的高效定位与预测,积极推进我国高铁技术的发展。
【关键词】:零部件质量 动车组 Chameleon聚类 Hadoop 质量问题定位
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 致谢5-6
- 摘要6-7
- ABSTRACT7-11
- 1 引言11-18
- 1.1 研究背景11-12
- 1.2 研究现状12-14
- 1.2.1 国外研究现状12-14
- 1.2.2 国内研究现状14
- 1.3 研究内容及意义14-16
- 1.3.1 研究内容15
- 1.3.2 研究意义15-16
- 1.4 论文组织结构16-18
- 2 理论及相关技术综述18-32
- 2.1 HADOOP系统18-22
- 2.1.1 分布式文件系统HDFS19-21
- 2.1.2 MapReduce研究21-22
- 2.2 聚类分析介绍22-25
- 2.3 聚类分析算法分类25-30
- 2.4 算法的比较与选择30-32
- 2.4.1 聚类算法比较30-31
- 2.4.2 聚类算法选择31-32
- 3 CHAMELEON算法的改进及并行化实现32-46
- 3.1 现有CHAMELEON算法介绍32-36
- 3.1.1 传统Chameleon算法32-33
- 3.1.2 M-Chameleon算法33-35
- 3.1.3 算法存在的问题35-36
- 3.2 CHAMELEON算法改进36-46
- 3.2.1 算法改进的思想36-38
- 3.2.2 MR-Chameleon算法的实现38-40
- 3.2.3 基于hadoop的MR-Chameleon算法并行化设计与实现40-42
- 3.2.4 算法性能分析42-46
- 4 动车组质量问题定位与预测46-59
- 4.1 动车组质量问题需求分析46
- 4.2 实验数据46-51
- 4.2.1 数据的选取47-48
- 4.2.2 数据预处理48-51
- 4.3 实验环境及过程51-54
- 4.3.1 实验环境51-52
- 4.3.2 实验过程52-54
- 4.4 实验结果分析54-59
- 4.4.1 质量问题定位55-56
- 4.4.2 质量问题预测56-57
- 4.4.3 实验结果可视化展示57-59
- 5 总结与展望59-61
- 5.1 工作总结59
- 5.2 工作展望59-61
- 参考文献61-64
- 作者简历及攻读硕士学位期间取得的研究成果64-66
- 学位论文数据集66
【相似文献】
中国期刊全文数据库 前10条
1 李斌,郭剑毅;聚类分析在客户关系管理中的研究与应用[J];计算机工程与设计;2005年02期
2 张宏翔;李星;;基于聚类分析的学生学习相关性研究[J];计算机光盘软件与应用;2013年11期
3 蔡建国;;排序聚类分析在成组技术中的应用[J];机械工艺师;1985年01期
4 董玉祥;排序聚类分析计算程序[J];成组生产系统;1986年01期
5 A·Gongaware,Inyong Ham,焦虹;用于成组制造系统的聚类分析法[J];成组生产系统;1986年02期
6 史逸芬,蔡建国;排序聚类分析法在相似零件成组中的应用[J];成组生产系统;1986年03期
7 徐大威,王鸿歌;聚类分析应用程序系统[J];冶金自动化;1988年01期
8 张春早;会议评判与聚类分析[J];机械工程;1988年02期
9 吴国安;聚类分析在鸟的分类中的应用[J];黑龙江大学自然科学学报;1989年04期
10 卢泽生;;零件分类成组的聚类分析法[J];机械工程师;1990年04期
中国重要会议论文全文数据库 前10条
1 梅翠;;我国各地区居民收入差距及其对消费的制约[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 李均立;傅国华;;海南各县(市)经济实力的聚类分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
3 刘黄金;曹林峰;;南京服务业发展的聚类分析[A];江苏省现场统计研究会第十次学术年会论文集[C];2006年
4 肖静;杨泽峰;徐辰武;;微阵列表达谱监督聚类分析方法的比较研究[A];江苏省遗传学会第七届代表大会暨学术研讨会论文摘要汇编[C];2006年
5 路爱峰;崔玉杰;;沪市电力上市公司经营业绩的聚类分析[A];中国数学力学物理学高新技术交叉研究学会第十二届学术年会论文集[C];2008年
6 陈国华;廖小莲;夏君;;证券投资分析的聚类分析方法[A];中国企业运筹学[2011(1)][C];2011年
7 张红卫;隗金水;;聚类分析评价与测量效度关系探讨[A];第九届全国体育科学大会论文摘要汇编(4)[C];2011年
8 牛东晓;乞建勋;;网络资源平衡问题的聚类分析优化遗传算法研究[A];2001年中国管理科学学术会议论文集[C];2001年
9 詹原瑞;彭书杰;李如一;;基于聚类分析的企业信用等级评价方法[A];西部开发与系统工程——中国系统工程学会第12届年会论文集[C];2002年
10 邹晓玫;修春波;;基于聚类分析的犯罪率相关因素的研究[A];当代法学论坛(二○一○年第3辑)[C];2010年
中国博士学位论文全文数据库 前4条
1 张建萍;基于计算智能技术的聚类分析研究与应用[D];山东师范大学;2014年
2 李成安;分布式环境下聚类分析新方法的研究[D];浙江大学;2006年
3 杨旭杰;基于统计方法模型分析的中药复方专利保护研究[D];北京中医药大学;2012年
4 李宝玲;王裕颐教授学术思想与临床经验总结及治疗眩晕证治规律研究[D];北京中医药大学;2012年
中国硕士学位论文全文数据库 前10条
1 李元俊;大学生就业能力培养与社会需求的匹配性研究[D];山东建筑大学;2015年
2 冯雪冰;基于模糊理论的EM算法在聚类分析的应用研究[D];中国地质大学(北京);2015年
3 黄银;行业地区发展水平的聚类分析[D];苏州大学;2015年
4 郭俊峰;聚类分析下的股票投资价值挖掘研究[D];大连海事大学;2015年
5 张旭;考虑风电接入不确定性的节点特性建模研究[D];山东大学;2015年
6 褚旭;我国各省市CDM项目聚类分析及影响因素研究[D];首都经济贸易大学;2015年
7 刘鑫琳;VAGUE集理论及其在聚类分析中的应用[D];广西大学;2015年
8 周颖;基于蚁群算法的聚类分析在学生成绩中的研究[D];南昌大学;2015年
9 邢蕊;以聚类分析为基础的我国证券公司效率研究[D];山西大学;2015年
10 王帅宇;K-Means算法在用户细分方面的应用研究[D];北京理工大学;2015年
本文关键词:动车组质量数据聚类分析研究与应用,由笔耕文化传播整理发布。
,本文编号:341887
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/341887.html