基于大数据的公交车辆状态细分与故障预测研究
发布时间:2021-08-04 08:11
随着公共交通的快速发展,公交车辆的运营强度不断增加,在高强度超负荷运行中公交车辆会出现各种突发性问题。公交集团公司在运营维护过程中产生大量数据,如何有效利用数据资产建立一套公交大数据的分析体系,从而指导公交车辆的安全维护工作是十分重要的。本文首先对车辆状态和故障预测进行文献分析,针对当前基于大数据的公交车辆健康状况分析预测理论和实践还处于起步阶段,需要更多的理论探索和实践应用。本文依据北京公交集团车辆采集的整车数据同时结合维修保养数据和外部天气影响,使用数据挖掘和大数据的分析方法选取公交数据围绕车辆故障状态进行研究,得到车辆状态细分与关键故障的预测。其次介绍了公交大数据组成和公交数据的转存和预处理流程,从车辆价值角度,选取近度、频度和时间作为公交车辆状态分析指标,运用k-means聚类方法对公交车辆进行细分,分别赋予不同的车辆标签,在后续车辆的维修保养过程中可以参考这些标签化信息,针对不同的车辆优化保养维修策略,从而为车辆保养维修单位提供一些借鉴和建议。然后针对公交故障信息类型,通过短文本挖掘技术对公交故障信息进行特征提取,得到公交车辆关键故障部位,发动机故障是最显著的故障特征,其次是...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
图2-1聚类分析的基本步骤流程??Figure?2-1?Basic?steps?of?cluster?analysis??
声数据的产生主要有采集的数据恒定无变化和数据字段0等默认一数据值,需要将这些噪音数据去除。??(3)重复记录和无效字段的处理??在数据清洗过程中,由于数据表众多,数据量比较大,需要借助工具选,在对公交数据进行处理过程中借助ETL技术结合数据清洗工具KE复值和无效字段进行处理。Kettle去除重复记录的Unique?rows=除去输入流中的重复行,如图3-1所示(在使用该节点前要先排序,否连续的重复行)在去重操作中的流程如下:??1、从数据流里读取输入字段。??2、对数据流的字段进行模糊算法的匹配并查询。??3、返回相应的匹配结果。??4、使用过滤记录的步骤选择出相似的记录。??5、查询校验值是否准确。??6、最后使用过滤记录的步骤过滤掉重复的记录。??
针对每一次K的不同取值,我们进行30次迭代计算,并同时计算轮廓系数的大??小,通过每次轮廓系数叠加的平均值作为最终评价标准,可以看到K与轮廓系??数的关系如图3-2所示:??轮廓系数与K的关系??味2?-?\??驗?\??V?v?一??—I?I?I?I?I?I?I ̄ ̄??2?3?4?5?6?7?8??K??图3-2?K与轮廓系数的关系??Figure?3-2?The?relationship?between?K?and?the?contour?factor??当K值等于3时,有最大的轮廓系数,这与我们选取聚类的个数相吻合。??很好的验证了聚类个数的合理性。由于指标选取是三维数据,可视化效果不容易??体现,所以通过多维定标的方式将纬度将至二维,查看聚类效果,如图3-3所示。??kmeans聚类?k=3??s??巧?七冬??????*?V.*??以_??-??■?I?I?I?I?I?I?I?\??-5?-3?-10?12??mds[,1]??图3-3聚类效果图??Figure?3-3?The?clustering?effect?diagram??30??
本文编号:3321346
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
图2-1聚类分析的基本步骤流程??Figure?2-1?Basic?steps?of?cluster?analysis??
声数据的产生主要有采集的数据恒定无变化和数据字段0等默认一数据值,需要将这些噪音数据去除。??(3)重复记录和无效字段的处理??在数据清洗过程中,由于数据表众多,数据量比较大,需要借助工具选,在对公交数据进行处理过程中借助ETL技术结合数据清洗工具KE复值和无效字段进行处理。Kettle去除重复记录的Unique?rows=除去输入流中的重复行,如图3-1所示(在使用该节点前要先排序,否连续的重复行)在去重操作中的流程如下:??1、从数据流里读取输入字段。??2、对数据流的字段进行模糊算法的匹配并查询。??3、返回相应的匹配结果。??4、使用过滤记录的步骤选择出相似的记录。??5、查询校验值是否准确。??6、最后使用过滤记录的步骤过滤掉重复的记录。??
针对每一次K的不同取值,我们进行30次迭代计算,并同时计算轮廓系数的大??小,通过每次轮廓系数叠加的平均值作为最终评价标准,可以看到K与轮廓系??数的关系如图3-2所示:??轮廓系数与K的关系??味2?-?\??驗?\??V?v?一??—I?I?I?I?I?I?I ̄ ̄??2?3?4?5?6?7?8??K??图3-2?K与轮廓系数的关系??Figure?3-2?The?relationship?between?K?and?the?contour?factor??当K值等于3时,有最大的轮廓系数,这与我们选取聚类的个数相吻合。??很好的验证了聚类个数的合理性。由于指标选取是三维数据,可视化效果不容易??体现,所以通过多维定标的方式将纬度将至二维,查看聚类效果,如图3-3所示。??kmeans聚类?k=3??s??巧?七冬??????*?V.*??以_??-??■?I?I?I?I?I?I?I?\??-5?-3?-10?12??mds[,1]??图3-3聚类效果图??Figure?3-3?The?clustering?effect?diagram??30??
本文编号:3321346
本文链接:https://www.wllwen.com/kejilunwen/qiche/3321346.html