数据驱动的复杂工业过程统计过程监测
发布时间:2020-04-09 10:17
【摘要】:工业过程生产安全是是新一代工业革命的重要保障之一。过程监测技术是实现工业过程安全生产的重要手段,是保障制造业转型升级,实现智能制造的基本技术之一。随着数据测量及存储技术的飞速发展,工业过程中积累了丰富的过程数据,这些数据蕴含了丰富的过程信息,因而,数据驱动的过程监测方法受到了广泛的关注。其中,多元统计分析的方法因其在处理高耦合、多变量数据的独特优势而备受青睐。传统的统计过程监测方法往往做了一些理想化的假设条件,如认为建模数据往往是充足且规则的、过程变量往往服从单一的线性关系或者非线性关系、过程数据往往是来自稳定工况等。这些假设条件使得传统的统计过程监测方法在一定的适用范围内取得了较好的应用效果。然而,随着工业过程的过程特性日益复杂、过程规模日益庞大,实际的工业过程往往处于一种复杂的非理想的运行工况下,无法满足理想化的假设条件,从而导致传统的统计过程监测方法性能下降甚至无法适用。间歇生产过程和连续生产过程是当今工业过程的两大主要生产方式,且间歇过程由于其多操作阶段、周期生产的特点往往具有复杂的过程特性,而连续过程的大规模化趋势也使得其过程特性日益复杂,它们的实际运行工况往往违背了理想的假设条件。因此,以间歇过程和大规模连续过程为研究对象分析实际工业过程中的复杂特性,并针对其中的典型问题进行研究,主要有间歇过程中的小样本问题、不规则数据问题以及大规模连续过程中的混合变量相关性问题、动态性问题:(1)由于过程反应缓慢,一些间歇过程(如生物制药)往往难以获取充足的批次数据用以分析建模,导致小样本问题的存在。针对小样本问题,本文建立了一种新的数据分析单元—泛化时间片,并提出一种基于泛化时间片的间歇过程有序时段划分算法。该方法通过衡量泛化时间片中过程数据的相关性从而自动有序地识别间歇过程的多个时段,为可靠的过程监测奠定基础。此外,所建立的子时段监测模型能随着建模数据的增多而进行更新,从而实现精确的过程监测。(2)由于各种因素的影响,间歇过程往往不能严格地重复生产,因此间歇操作的数据长度也不可能完全相同,导致不规则数据问题。针对间歇过程不规则数据问题,本文提出一种基于时间片重组的不等长时段有序自动划分算法,通过衡量每个批次的数据相关性在时间方向的变化情况对不规则的子时段进行识别,并建立时段模型提取不规则的过程特性。此外,考虑到时间指标无法有效指示新样本的时段隶属,本算法对每个不规则时段进行了细划分,区分了两类时间区域,并针对不同区域提出不同的在线监测策略。该策略避免了因不规则时段识别错误而导致的误报警情况,从而可以有效改善在线监测性能。(3)由于大规模连续过程往往由若干设备、生产线等构成,它们的运行机制不同且相互影响,因此过程变量问往往存在着混合的变量相关性,即同时存在线性相关性和非线性相关性。针对混合相关性问题,本文首次提出混合变量相关性解耦的思想,并基于该思想提出一种线性关系衡量以及线性变量组划分的方法,将过程分解成具有不同变量相关性的线性子组和非线性子组。在过程分解的基础上,提出一种两层的精细化建模和监测的框架:在底层对系统局部的线性特征进行分析和监测;在上层分析和监测过程的全局非线性特性。该方法对过程的线性特征和非线性特征分别表征和监测,可以有效改善大规模混杂过程的在线监测性能。(4)对于具有高维度、混合变量相关性数据的大规模过程,故障易被掩盖且往往同时具有线性和非线性的特征,从而导致故障特性难以精确表征。因此,本文在混合变量相关性解耦的基础上进一步提出复杂故障特性分解的思想,并基于该思想提出一种分布式的概率故障诊断方法。该方法根据故障特性将过程分解为不同的子块,有利于故障特性的精确表征。随后,根据子块所包含的故障特性采用相应的建模方法建立分布式的故障诊断系统,该系统中不同的子块模型可以提取不同的故障特征,并通过信息融合技术进行有效融合,显著改善了故障诊断精度。此外,采用概率的形式来表示故障诊断的结果,不仅可以有效指示故障类别,还反映了样本属于该故障类别的程度,揭示了更丰富的故障信息。(5)由于控制策略切换,产品更改等因素,实际工业过程往往存在显著的动态变化特性。此外,大规模连续过程因其包含了多个运行设备、生产线甚至车间而具有更为复杂、显著的动态变化行为。针对大规模连续过程的动态性问题,提出一种基于动静特性分析的分布式协同建模与监测方法。首先提出一种稀疏慢特征分析算法对过程数据的动静态相关性进行评估,并基于评估结果设计变量组迭代划分方法自动将过程分解为具有不同的动静态特性的变量子组。随后,提出一种新的分布式协同建模方法:在每个变量子组采用SFA分别表征过程局部的动静态特性,并采用KSFA算法表征变量子组间的全流程的动静态特性。该方法从动态和静态、局部和全局对大规模过程的过程特性进行精细化表征,为过程监测提供更为丰富和关键的信息,从而可以有效提高监测性能。上述方法针对实际工业过程中复杂特性所带来的一系列问题提出了新的解决思路,并在数值仿真例子和实际工业过程的仿真实验中验证了其可靠性和有效性。最后,在总结本文研究的基础上,对未来工作进行了展望。
【图文】:
些“短时间片”没有包含充分的批次数据以揭示批次方向的统计波动特性,从而导致以传统逡逑时间片为数据分析单元的统计建模方法不再适用。因此,需要构建一种新的数据分析单元。逡逑这里,根据“泛化时间片’’的思想1571进行新数据分析单元的构造。如图2.1所示,选取了一逡逑些连续的“短时间片”组成了一个泛化时间片xaaxj)。其中,,(是泛化时间片所包含的时逡逑间跨度,故#表示每个泛化时间片所包含的样本个数。f应当根据具体过程特性适当地选逡逑择。若f过大,则泛化时间片所包含的时间维度的波动信息过大而导致批次上的波动特性逡逑被掩盖;若(过小,则可能无法提供充足的批次数据。一般来说,为了提供可靠的数据标逡逑准化信息,6通常的选取范围为过程变量个数的2?3倍[|331。在每个泛化时间片所包含的逡逑时刻中,可以近似认为过程特性并未发生显著变化,能够提供较为可靠数据标准化信息,逡逑代表当前时刻批次的平均轨迹和波动水平。对于每个泛化时间片,数据标准化信息与窗口逡逑中部时间6邋/2对应
浙江大学博士学位论文逦第二椝越了?小样本的间歇过程子时段划分、统计建揆与监测逡逑图2.3监测系统对(a)正常批次的在线监测结果(b)故障批次的在线监测结果逡逑10逦I逦i逦i逦i逦I逦;逡逑:逡逑0逦100逦200逦300逦400逦500逦600逡逑Samples逡逑1逡逑10逦逦1逦1逦1逦1逦1逦:逡逑0逦100逦200逦300逦400逦500逦600逡逑Samples逡逑(a)逡逑1邋^^1邋^逡逑102/||l逦i逡逑'01逦;逡逑!逦^逦ii逦:逡逑100l逦1逦1逦'逦'逦1逦逡逑0逦1邋00逦200逦300逦400逦500逦600逡逑Samples逡逑102邋逦1逦.逦1逦1逦1逦:逡逑m邋101邋-邋J邋^邋*逦-逡逑:逡逑;逦,逦iij:逦i逦i邋'、-逦;逡逑0逦1
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TB114
本文编号:2620626
【图文】:
些“短时间片”没有包含充分的批次数据以揭示批次方向的统计波动特性,从而导致以传统逡逑时间片为数据分析单元的统计建模方法不再适用。因此,需要构建一种新的数据分析单元。逡逑这里,根据“泛化时间片’’的思想1571进行新数据分析单元的构造。如图2.1所示,选取了一逡逑些连续的“短时间片”组成了一个泛化时间片xaaxj)。其中,,(是泛化时间片所包含的时逡逑间跨度,故#表示每个泛化时间片所包含的样本个数。f应当根据具体过程特性适当地选逡逑择。若f过大,则泛化时间片所包含的时间维度的波动信息过大而导致批次上的波动特性逡逑被掩盖;若(过小,则可能无法提供充足的批次数据。一般来说,为了提供可靠的数据标逡逑准化信息,6通常的选取范围为过程变量个数的2?3倍[|331。在每个泛化时间片所包含的逡逑时刻中,可以近似认为过程特性并未发生显著变化,能够提供较为可靠数据标准化信息,逡逑代表当前时刻批次的平均轨迹和波动水平。对于每个泛化时间片,数据标准化信息与窗口逡逑中部时间6邋/2对应
浙江大学博士学位论文逦第二椝越了?小样本的间歇过程子时段划分、统计建揆与监测逡逑图2.3监测系统对(a)正常批次的在线监测结果(b)故障批次的在线监测结果逡逑10逦I逦i逦i逦i逦I逦;逡逑:逡逑0逦100逦200逦300逦400逦500逦600逡逑Samples逡逑1逡逑10逦逦1逦1逦1逦1逦1逦:逡逑0逦100逦200逦300逦400逦500逦600逡逑Samples逡逑(a)逡逑1邋^^1邋^逡逑102/||l逦i逡逑'01逦;逡逑!逦^逦ii逦:逡逑100l逦1逦1逦'逦'逦1逦逡逑0逦1邋00逦200逦300逦400逦500逦600逡逑Samples逡逑102邋逦1逦.逦1逦1逦1逦:逡逑m邋101邋-邋J邋^邋*逦-逡逑:逡逑;逦,逦iij:逦i逦i邋'、-逦;逡逑0逦1
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TB114
【参考文献】
相关博士学位论文 前1条
1 赵春晖;多时段间歇过程统计建模、在线监测及质量预报[D];东北大学;2009年
本文编号:2620626
本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/2620626.html