卫星遥测数据相关性知识发现方法研究
发布时间:2020-09-17 15:32
卫星遥测数据相关性知识发现,是研究一个遥测变量在不同时段的取值、或者两个及两个以上遥测变量的取值之间是否存在有效的、新颖的、潜在有用的、最终可理解的相关关系,并对具有相关关系的遥测变量探讨其相关方向、相关程度、相关结构、相关知识表示的一项工作。遥测数据表现的大规模、高维度、非线性等特征,为遥测数据的相关性分析提出了严峻的挑战。本文以卫星集成测试、地面应用系统的业务拓展需求为研究背景,通过开展遥测数据相关关系特点分析、类别抽象、测度选择、方法改进等方面的研究工作,提出适用于航天器遥测数据的相关性知识发现方法,这对于卫星系统的总装集成、在轨测试、运控管理都具有非常重要的意义。论文主要研究内容包括:1)遥测数据自相关知识发现方法研究针对现有两种知识发现方法中,传统方法难以实现知识构建的自动化,而纯数据驱动方法会忽略卫星系统设计和遥测数据本身特性的问题,在分析并抽象出遥测领域普遍存在的6种自相关关系,并对之进行建模和向量表示的基础上,提出一种基于领域模型的归纳式遥测数据自相关知识发现方法。试验结果表明,所提方法能够自动化构建符合卫星系统设计的自相关知识,且基于这些知识可以有效的检测出遥测数据的部分异常。2)遥测数据互相关测度评价及最优测度面向遥测数据互相关测度评价方法以及最优测度均未明确的领域研究现状,基于遥测数据互相关关系的强非线性、动态性,以及遥测数据本身具有的大规模、高维度等特点,提出了以覆盖度、新颖度衡量普适性、以平均运行时间衡量时效性的相关性测度评价标准,量化分析并试验验证了在此标准之下遥测数据互相关分析的最优测度-最大信息系数(Maximum Correlation Coefficient,MIC)。3)基于改进最大信息系数的互相关程度知识发现方法针对基于最大信息系数进行大规模、高维度遥测数据互相关分析时遇到的(1)测度偏向多值变量(2)动态规划算法时间复杂度高等问题,提出了以Mini Batch K-Means聚类为前驱过程对数据进行网格划分,以信息熵代替最大熵对互信息进行归一化矫正的改进MIC方法。试验结果表明,与基于动态规划的MIC方法相比,所提方法可有效解决MIC测度偏向多值变量的问题,时间复杂度从(9)~(2.4))下降为从(9)~(1.6)),是一种适用于大规模数据相关性分析的有效方法;4)基于混合采样与XGBoost模型的互相关结构知识发现方法针对传统遥测数据相关性分析方法仅能发现相关程度知识,无法提供相关结构丰富信息的问题,提出一种基于混合采样、代价矩阵、极限梯度提升(eXtreme Gradient Boosting,XGBoost)的互相关结构知识发现方法。试验结果表明:较之于反向传播神经网络和长短时记忆网络,所提方法在ROC(Receiver Operating Characteristic)曲线、F1-score等性能指标方面具有更高的分类精度,且对类别不平衡数据不敏感,是一种适用于遥测数据互相关结构知识发现的有效方法。
【学位单位】:中国科学院大学(中国科学院国家空间科学中心)
【学位级别】:博士
【学位年份】:2019
【中图分类】:TP311.13;V557
【部分图文】:
关系数的影响,客观的度量2个变量的相关关系系数的概念,又称秩相关系数、等级相随机变量之间的单调关系。数基于原始数据,而Spearman相关系数④ ⑤为一个二维随机变量,④ ⑤为两 ④ ⑤④ ⑤ ④ ⑤ ④ ⑤ 列⑥ ⑦中的秩, 是 在序列⑥ ),该值对应的秩为等值对应秩的均值
图 3-8 基于遥测数据周期相关特征的异常检测 Anomaly detection based on the feature of cycle correlation of telem-4:周期相关可表示为七元组: ( 测变量标识, 最大周期, 为最小周期, 为幅值, 为阈值, 为输入点数。即标识为 的参数,任序列做快速傅里叶变换,假设幅值最大点的周期、幅值为计量 ,且 ⑧ ], ⑧ ⑨大、最小值,不是针对一组数据做傅里叶变换得到的最大采用滑动窗口的方法[87](图 3-9),针对不同组数据做变数(周期、幅值)的统计范围。500 1000 1500 2000 2500-500005000正常状态异常状态
图 5-7 K-Means与Mini Batch K-Means聚类效果差异Fig. 5-7 Defference of effect between K-Means and Mini Batch K-Means图 5-7给出了 样本点分别使用K-Means和Mini Batch K-Means聚类效果的差异[105]。由图可见,在 样本点情况下,二者的运行时间相差2倍多,但聚类结果差异却很小。因此Mini Batch K-Means是一种能尽量保持聚类准确性且能大幅度降低计算时间的聚类模型。给定样本集 ⑥ ⑦, 为样本容量。 将被划分为 个簇,簇的中心为 ⑥ ⑦。Mini Batch K-Means聚类的迭代步骤如下:1) 从 中随机选择 个样本作为初始中心 ;2) 从 中随机抽取容量为 的样本子集 ,组成一个Batch;3) 对 中每一个样本点 ,计算其与 个簇类中心的相似度,将样本点 划入相似度最大的簇;4) 中所有样本经过3)步骤后,根据各样本的簇标号重新计算聚类中心;
本文编号:2820899
【学位单位】:中国科学院大学(中国科学院国家空间科学中心)
【学位级别】:博士
【学位年份】:2019
【中图分类】:TP311.13;V557
【部分图文】:
关系数的影响,客观的度量2个变量的相关关系系数的概念,又称秩相关系数、等级相随机变量之间的单调关系。数基于原始数据,而Spearman相关系数④ ⑤为一个二维随机变量,④ ⑤为两 ④ ⑤④ ⑤ ④ ⑤ ④ ⑤ 列⑥ ⑦中的秩, 是 在序列⑥ ),该值对应的秩为等值对应秩的均值
图 3-8 基于遥测数据周期相关特征的异常检测 Anomaly detection based on the feature of cycle correlation of telem-4:周期相关可表示为七元组: ( 测变量标识, 最大周期, 为最小周期, 为幅值, 为阈值, 为输入点数。即标识为 的参数,任序列做快速傅里叶变换,假设幅值最大点的周期、幅值为计量 ,且 ⑧ ], ⑧ ⑨大、最小值,不是针对一组数据做傅里叶变换得到的最大采用滑动窗口的方法[87](图 3-9),针对不同组数据做变数(周期、幅值)的统计范围。500 1000 1500 2000 2500-500005000正常状态异常状态
图 5-7 K-Means与Mini Batch K-Means聚类效果差异Fig. 5-7 Defference of effect between K-Means and Mini Batch K-Means图 5-7给出了 样本点分别使用K-Means和Mini Batch K-Means聚类效果的差异[105]。由图可见,在 样本点情况下,二者的运行时间相差2倍多,但聚类结果差异却很小。因此Mini Batch K-Means是一种能尽量保持聚类准确性且能大幅度降低计算时间的聚类模型。给定样本集 ⑥ ⑦, 为样本容量。 将被划分为 个簇,簇的中心为 ⑥ ⑦。Mini Batch K-Means聚类的迭代步骤如下:1) 从 中随机选择 个样本作为初始中心 ;2) 从 中随机抽取容量为 的样本子集 ,组成一个Batch;3) 对 中每一个样本点 ,计算其与 个簇类中心的相似度,将样本点 划入相似度最大的簇;4) 中所有样本经过3)步骤后,根据各样本的簇标号重新计算聚类中心;
【参考文献】
相关期刊论文 前10条
1 李江;郝新梅;范琳琳;毛晓敏;;黑河中游绿洲地下水位空间变异性研究[J];水力发电学报;2015年11期
2 钱宇华;成红红;梁新彦;王建新;;大数据关联关系度量研究综述[J];数据采集与处理;2015年06期
3 王鹏;张善从;;基于最大信息系数的时延数据相关性分析方法[J];电子测量技术;2015年09期
4 姚晓阳;孙晓蕾;吴登生;杨玉英;;基于互信息熵的国家风险相关性研究[J];系统工程理论与实践;2015年07期
5 徐承龙;吴倩;孙丽华;;组合风险的重要性抽样方法[J];同济大学学报(自然科学版);2015年04期
6 罗清华;焉晓贞;彭宇;彭喜元;;基于滑动窗口模式匹配的动态距离估计方法[J];仪器仪表学报;2015年03期
7 陶凤和;马万里;贾长治;牟鹏博;苏京晶;;部件相关的某自行火炮变速箱齿轮系统可靠性分析[J];机械传动;2014年09期
8 吴婧;苏振华;孙诚;;一种基于Kalman滤波的卫星遥测数据判读系统[J];航天器工程;2014年03期
9 张强;郭丽丽;马振林;;基于模型自动判读的研究与实现[J];计算机技术与发展;2014年07期
10 李维铮;孟桥;;基于遥测数据动态特征的卫星异常检测方法[J];空间科学学报;2014年02期
本文编号:2820899
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2820899.html