基于统计软件R的安全壳泄漏率试验数据有效性分析
发布时间:2021-11-24 17:17
安全壳泄漏率计算过程中,最重要的环节是以不同时刻测量数据对时间进行线性回归分析。对回归的显著性检验以及方差分析是评价试验结果有效性的重要手段。本文基于统计软件R对某电厂调试阶段安全壳泄漏率试验的数据进行分析,通过对线性回归模型的独立性、正态性和异方差性检验以及极端样本点的剔除等方式,探讨泄漏率计算前的回归诊断对计算结果可靠性的影响。通过回归诊断的实例分析发现,在安全壳泄漏率计算的数据样本中,可能存在自相关、非正态和异方差性等问题影响回归结果,进而影响泄漏率的最终结果。因此,在计算泄漏率结果时,须通过回归诊断方法评价数据的有效性,对不能通过检验的样本应通过适当方法对最终结果进行修正。
【文章来源】:核动力工程. 2020,41(05)北大核心EICSCD
【文章页数】:5 页
【部分图文】:
拟合模型的诊断图d残差杠杆值
??验和拉格朗日乘数检验实现。正态性是指误差(残差)项满足正态分布,检测误差(残差)项之间的正态性可以使用夏皮罗-威尔克检验。异方差性是指残差的方差不会随应变量的拟合值而增加,异方差性检验通过布伦斯-帕甘检验实现。表1给出了对自相关性、正态性以及异方差性的检验结果和简单的评价。2.2极端样本点的剔除高斯-马尔可夫假设认为每个样本对模型造成的影响是均匀的,一旦在样本中存在极端样本点,回归拟合效果会受到影响,进而影响泄漏率计算结果,因此需要对极端样本点进行剔除。图2给出了4h内安全壳内干空气质量对时间的线性回归曲线以及质量点的分布情况,直观上可以看出,有个别数据点偏离回归曲线。研究发现,存在占比较高的绝对值较大的残差,这也是正态性检验不通过的原因之一,在剔除极端的样本点图2安全壳内干空气质量对时间的散点图Fig.2ScatterPlotofMassinContainmentoverTime后残差的正态性将得到改善。首先,根据单个最大残值的显著性判断是否有离群点,通过邦费罗尼校正判断本样本无学生化残差(P<0.05)。图1中红色的均值线,说明数据中有特别影响回归结果的异常点;图1b中少量的点落在[-2,2]区间外,这些点应被认为是异常点;图1a中红色线呈现出一条平稳的曲线,但并没有明显的形状特征,说明除了个别异常点外残差数据表现非常好。综合分析,索引编号为1、12、47这3个点在多幅诊断图中出现,假设这3个点为异常点,从数据中去掉后再对模型进行显著性检验和残差分析,表2、表3给出了修正前后重要回归参数的对比情况,其中状态1、状态2分别表示修正前和修正后。从图3中的各项检验?
夏皮罗-威尔克统计量布伦斯-帕甘检验(R软件car包)布伦斯-帕甘检验(R软件lmtest包)总体结果偏度统计量峰度统计量联系系数异方差性统计量10.70622.1350.9371.4021.01522.4596.2621.18813.5861.403P<0.001P=0.014P=0.011P=0.236P=0.313P<0.001P=0.012P=0.275P<0.001P=0.23620.74822.9120.97531.6841.85312.681698490.06310.2351.684P<0.001P=0.006P=0.429P=0.194P=0.173P=0.012P=0.403P=0.800P=0.001P=0.194a残差拟合图c位置尺寸图b正态QQ图d残差杠杆值图3剔除极端样本点后的拟合模型的诊断图Fig.3DiagnosticPlotsforFittingModelafterEliminatingOutliers
本文编号:3516427
【文章来源】:核动力工程. 2020,41(05)北大核心EICSCD
【文章页数】:5 页
【部分图文】:
拟合模型的诊断图d残差杠杆值
??验和拉格朗日乘数检验实现。正态性是指误差(残差)项满足正态分布,检测误差(残差)项之间的正态性可以使用夏皮罗-威尔克检验。异方差性是指残差的方差不会随应变量的拟合值而增加,异方差性检验通过布伦斯-帕甘检验实现。表1给出了对自相关性、正态性以及异方差性的检验结果和简单的评价。2.2极端样本点的剔除高斯-马尔可夫假设认为每个样本对模型造成的影响是均匀的,一旦在样本中存在极端样本点,回归拟合效果会受到影响,进而影响泄漏率计算结果,因此需要对极端样本点进行剔除。图2给出了4h内安全壳内干空气质量对时间的线性回归曲线以及质量点的分布情况,直观上可以看出,有个别数据点偏离回归曲线。研究发现,存在占比较高的绝对值较大的残差,这也是正态性检验不通过的原因之一,在剔除极端的样本点图2安全壳内干空气质量对时间的散点图Fig.2ScatterPlotofMassinContainmentoverTime后残差的正态性将得到改善。首先,根据单个最大残值的显著性判断是否有离群点,通过邦费罗尼校正判断本样本无学生化残差(P<0.05)。图1中红色的均值线,说明数据中有特别影响回归结果的异常点;图1b中少量的点落在[-2,2]区间外,这些点应被认为是异常点;图1a中红色线呈现出一条平稳的曲线,但并没有明显的形状特征,说明除了个别异常点外残差数据表现非常好。综合分析,索引编号为1、12、47这3个点在多幅诊断图中出现,假设这3个点为异常点,从数据中去掉后再对模型进行显著性检验和残差分析,表2、表3给出了修正前后重要回归参数的对比情况,其中状态1、状态2分别表示修正前和修正后。从图3中的各项检验?
夏皮罗-威尔克统计量布伦斯-帕甘检验(R软件car包)布伦斯-帕甘检验(R软件lmtest包)总体结果偏度统计量峰度统计量联系系数异方差性统计量10.70622.1350.9371.4021.01522.4596.2621.18813.5861.403P<0.001P=0.014P=0.011P=0.236P=0.313P<0.001P=0.012P=0.275P<0.001P=0.23620.74822.9120.97531.6841.85312.681698490.06310.2351.684P<0.001P=0.006P=0.429P=0.194P=0.173P=0.012P=0.403P=0.800P=0.001P=0.194a残差拟合图c位置尺寸图b正态QQ图d残差杠杆值图3剔除极端样本点后的拟合模型的诊断图Fig.3DiagnosticPlotsforFittingModelafterEliminatingOutliers
本文编号:3516427
本文链接:https://www.wllwen.com/projectlw/hkxlw/3516427.html