当前位置:主页 > 科技论文 > 软件论文 >

基于时序数据层次聚类方法的工业过程监控操作规则挖掘

发布时间:2021-07-02 15:15
  现代流程工业过程中,由于分布式控制系统(DCS)等数据采集存储技术的广泛使用,生产过程中采集了大量的过程监控操作时间序列,其中蕴含了大量的操作经验信息。研究建立有效的时间序列数据挖掘的方法,可以提取过程监控操作数据中的监控操作规则,进而指导生产过程监控操作。针对时序数据中存在周期性或重复性的时间序列的特点,论文提出了一种基于符号区块化的层次聚类方法,可以有效地挖掘时序数据中存在规律性信息,将其运用到工业过程监控操作数据的处理中,达到提取碎片化操作经验规则的目的。论文的主要研究内容和取得的成果如下:1.面向含有周期性或重复性的时间序列,研究了时间序列相似度度量方法,针对时序数据的高维性和海量性特点,采用了符号聚合近似的时序数据降维处理方法,考虑到工业过程监控操作时序数据的连续性和方向性,提出了一种基于符号区块化处理的时序数据挖掘方法。2.为了对符号化后的时间序列进行聚类,提出了基于莱文斯坦距离的层次聚类方法,将时序数据的相似性匹配过程转化为字符数据的聚类过程,从而获得多种相似的字符串,多条相似的字符串形成一簇。面向工业过程监控操作数据挖掘,每一簇则代表了一种操作模式。作为应用示例,将此方... 

【文章来源】:北京化工大学北京市 211工程院校 教育部直属院校

【文章页数】:85 页

【学位级别】:硕士

【部分图文】:

基于时序数据层次聚类方法的工业过程监控操作规则挖掘


图1-1时间序列模型建立流程??Fig.?1-1?Time?series?modeling?procedures??型ARMA、HMM、ANN型中选择意一建立

时间序列,过程数据,工业,聚类


?北京化工大学硕士学位论文???Dlstauce?Agglomerative??(?A,B,?,D,E?)??(a.b.,c ̄)??广?L?、?????I?A?f-??,??__\^y??r^ ̄)?c ̄b ̄)?(c)?ro?ce)??图1-3凝聚层次聚类??Fig.?1-3?Agglomerative?hierarchical?clustering??1.2.3工业过程数据挖掘??伴随着工业信息化和计算计技术的飞速发展,数据信息含量日益丰富,我们??迎来了大数据时代,如何从大量的数据中提取我们所需的知识已经成为人们关注??的热点。在过程控制系统中,随着时间变化的过程变量(PV)数据在分布式控制系??统(DCS)中被监控记录[34]。在工业DCS等数据记录存储技术的支持下,很多工??厂积累了大量的产生、采集和处理的数据,一个工厂每天产生的数据以TB计算,??这些历史数据中包含设备运行状况、操作员操作记录与生产过程中各部分物料量??变化的记录等许多信息。但本质上,这些数据具有“多”、“杂”等特点,良莠不??齐。不求随机样本,而是全体数据;不求精确性,而是混杂性;不求因果,但求??相关。由于流程工业产生的数据具有海量性,连续性,关联性强等特点,要从这??些历史数据中挖掘出操作规则,需要扫描历史数据并对其使用各种数据预处理和??数据挖掘技术。由于智能数据分析与挖掘技术的蓬勃发展,其重要分支之一的面??向时间序列的数据挖掘技术渐渐进入了人们的视野当中。??在现代工业过程中,工业数据是以时序数据的形式生成的,即带有时间标签。??在实践中,通常需要研宄工业过程中多个参数或因素之间的相互作用,通过

流程图,数据挖掘,工业,流程


?北京化工大学硕士学位论文???状态。??要通过数据挖掘的方法将操作人员的操作经验挖掘出来,需要经历以下几个??过程:(1)数据源进行数据集成处理;(2)对数据进行筛选;(3)数据预处理;(4)数??据挖掘;(5)知识表达与解释。如图1-5为工业数据挖掘流程。??其中数据预处理阶段共有四种情况。(1)数据清理的作用主要是填充数据中??一些缺失值,去除噪声和识别离群点等;(2)数据集成是将数据分成多个数据集??合形成多个数据库;(3)数据归约使得数据集能够简化表示;(4)数据变换可以规??范化数据,将其概念分层等。??数据挖掘的前提是数据,其实现工具是算法,而最终的目的是获得数据中所??I?I?I?t??I?III??I?I?I?t??数据准备?I数据挖掘丨结果表达与解释丨??I?III??|,1??nI/I?nI??i\?i/N???I?III??I?III??I?III??I?III??I?III??!?I]?P数据集成^^数据选择预处理?数据晬掘?结果表达^丨??丨数据源?数据?目标数据丨预处理后数据丨?模式?知识丨??I?ill??I?ill??图1-5工业数据挖掘流程??Fig.?1-5?Industrial?data?mining?process??蕴含的信息。这是一个将计算机信息技术与数理统计、机器学习和人工智能领域??等技术进行融合的综合性技术,它包含各个领域的优点,将杂乱的海量数据中隐??藏的各种肉眼无法识别的知识发现并提取出来。有关数据分析方法主要有分类、??回归分析、聚类、关联规则、偏差分析等,针对不同的问题运用合适

【参考文献】:
期刊论文
[1]A Novel Parallel Scheme for Fast Similarity Search in Large Time Series[J]. YIN Hong,YANG Shuqiang,MA Shaodong,LIU Fei,CHEN Zhikun.  中国通信. 2015(02)
[2]高效率的K-means最佳聚类数确定算法[J]. 王勇,唐靖,饶勤菲,袁巢燕.  计算机应用. 2014(05)
[3]基于整体和局部相似性的序列聚类算法[J]. 戴东波,汤春蕾,熊赟.  软件学报. 2010(04)
[4]A New Fuzzy Clustering-Ranking Algorithm and Its Application in Process Alarm Management[J]. 朱群雄,耿志强.  Chinese Journal of Chemical Engineering. 2005(04)



本文编号:3260706

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3260706.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fb423***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com