时序数据序列模式挖掘
本文关键词:时序数据序列模式挖掘
更多相关文章: 遥测数据 特征表示 时间惩罚 全局平均序列 主旨模式挖掘 垂直数据表示 闭合模式挖掘
【摘要】:卫星遥测数据中蕴含了丰富的客观规律和知识,序列模式挖掘作为时间序列数据挖掘研究的一个重要分支,可为其提供有效的分析途径。从中挖掘出的隐含有用的信息,可为在轨卫星的安全管理与健康运行提供帮助。本文以某卫星供配电系统240余万行的电源数据为分析对象。在经过野值剔除、参数选择、周期分析之后,对5个具有代表性的遥测参数进行特征表示、主旨模式挖掘以及闭合模式挖掘。本文主要创新点如下:(1)针对现有分段线性表示方法中存在的压缩效率低、过于细化某些尖端子序列等问题,提出了一种基于关键点的特征表示方法FR_KP。顺序扫描整个序列,通过极值保持时间、变化幅度,以及转折点前后线段的斜率差值来判断是否为关键点。实验表明,该方法能够在实现高效压缩的同时,准确不失真地刻画原始序列的变化趋势。(2)针对现有主旨模式挖掘方法中存在的问题,如难以在质量与运行效率之间找到一个平衡点,匹配数较小的主旨序列容易被忽略等,提出了一种基于惩罚的全局平均序列主旨模式挖掘方法PGAS_Motifs。采用K-Means算法对子序列进行聚类,并将所有聚类中心作为不同的主旨模式输出。针对聚类过程中的两个关键问题:距离度量的选取、聚类中心的计算,分别提出了基于时间惩罚的动态时间弯曲距离PDTW以及基于PDTW的全局平均序列计算方法。PDTW在进行最短路径计算时引入惩罚因子,解决了因错误匹配而带来的距离失真问题;全局平均序列计算方法将同一簇中的所有序列作为一个整体进行考虑,避免了迭代过程中的误差传递,并解决了因“过度拟合”而带来的计算复杂度增加问题。实验表明,该方法能够成功提取出遥测数据中反映卫星工作状态的主旨模式序列;PDTW度量比DTW度量更加有效;全局平均序列计算方法与NLAAF相比,有更好的拟合效果。(3)针对传统频繁模式挖掘中存在的结果集合冗余且有效模式难以发现,以及现有以模式增长为基础的闭合模式挖掘方法效率低下等问题,提出了一种将垂直数据表示与启发式剪枝策略相结合的闭合模式挖掘方法Clo PMVP。在闭合模式挖掘的过程中,引入SPADE算法中的垂直数据表示方法,在计算序列支持度时只需要进行简单交集操作,从而提高了计算效率;在进行序列模式扩展时,利用Clo Span算法中的回溯子模式和回溯超模式进行有效剪枝,来减小搜索空间。实验表明,当序列集合的平均序列长度较长或支持度较小时,挖掘效率较Clo Span算法有了明显的提升;此外,挖掘得到的闭合序列集合与SPADE算法的频繁序列集合相比,更加紧凑,有效信息更容易被发现。
【关键词】:遥测数据 特征表示 时间惩罚 全局平均序列 主旨模式挖掘 垂直数据表示 闭合模式挖掘
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13
【目录】:
- 摘要4-5
- ABSTRACT5-12
- 注释表12-13
- 第一章 绪论13-20
- 1.1 研究背景及意义13
- 1.2 国内外研究现状13-17
- 1.2.1 遥测数据分析技术的研究现状14-15
- 1.2.2 时序数据序列模式挖掘的研究现状15-17
- 1.3 本文研究内容及组织结构17-20
- 第二章 时序数据序列模式挖掘相关技术20-34
- 2.1 特征表示20-24
- 2.1.1 频域表示方法20-21
- 2.1.2 符号化表示方法21
- 2.1.3 奇异值分解表示法21-22
- 2.1.4 分段线性表示法22-24
- 2.2 主旨模式挖掘24-28
- 2.2.1 基本概念及定义24-26
- 2.2.2 EMMA算法26-28
- 2.3 闭合模式挖掘28-32
- 2.3.1 基本概念及定义28-29
- 2.3.2 Prefix Span算法29-31
- 2.3.3 Clo Span算法31-32
- 2.4 本章小结32-34
- 第三章 遥测数据特征分析及预处理34-47
- 3.1 遥测数据特性描述34-35
- 3.2 数据清洗35-37
- 3.3 遥测参数的选择37-38
- 3.3.1 基本原理37-38
- 3.3.2 实验分析38
- 3.4 周期分析38-41
- 3.4.1 基本原理39-40
- 3.4.2 实验分析40-41
- 3.5 基于关键点的特征表示方法41-46
- 3.5.1 基本原理41-42
- 3.5.2 实验分析42-46
- 3.6 本章小结46-47
- 第四章 遥测数据主旨模式挖掘算法研究47-65
- 4.1 相似性度量方法研究47-52
- 4.1.1 动态时间弯曲距离(DTW)48-49
- 4.1.2 问题的提出49-51
- 4.1.3 基于时间惩罚的DTW相似性度量方法51-52
- 4.2 平均序列计算方法研究52-55
- 4.2.1 DTW空间下的平均序列52-53
- 4.2.2 问题的提出53-54
- 4.2.3 基于PDTW的全局平均序列计算方法54-55
- 4.3 PGAS_Motifs算法描述55-58
- 4.4 实验分析58-63
- 4.4.1 实验结果58-60
- 4.4.2 结果分析60-63
- 4.5 本章小结63-65
- 第五章 遥测数据闭合模式挖掘算法研究65-80
- 5.1 参数离散化方法研究66-68
- 5.1.1 问题的提出66
- 5.1.2 基于聚类的离散化方法66-67
- 5.1.3 Clus Partion算法描述67-68
- 5.2 闭合模式挖掘方法研究68-75
- 5.2.1 问题描述及相关定义68-70
- 5.2.2 垂直数据表示70-71
- 5.2.3 有效闭合模式挖掘算法Clo PMVP71-72
- 5.2.4 Clo PMVP算法描述72-75
- 5.3 实验分析75-78
- 5.3.1 实验结果75-77
- 5.3.2 结果分析77-78
- 5.4 本章小结78-80
- 第六章 总结与展望80-82
- 6.1 本文总结80-81
- 6.2 展望81-82
- 参考文献82-87
- 致谢87-88
- 在学期间的研究成果及发表的学术论文88
【相似文献】
中国期刊全文数据库 前10条
1 张长海;胡孔法;陈凌;;序列模式挖掘算法综述[J];扬州大学学报(自然科学版);2007年01期
2 肖哲;任胜兵;;序列模式挖掘研究进展[J];科技信息(科学教研);2007年36期
3 陈卓;杨炳儒;宋威;宋泽锋;;序列模式挖掘综述[J];计算机应用研究;2008年07期
4 王虎;丁世飞;;序列模式挖掘研究与发展[J];计算机科学;2009年12期
5 陈晓;;一种模糊序列模式挖掘的有效方法[J];现代计算机(专业版);2010年13期
6 李乃乾;姚新会;田东平;;多时间粒度序列模式挖掘[J];小型微型计算机系统;2011年01期
7 吴孔玲;缪裕青;苏杰;张晓华;;序列模式挖掘研究[J];计算机系统应用;2012年06期
8 聂成林,王浩,胡学钢;基于概念格的序列模式挖掘[J];计算机工程;2003年20期
9 龚惠群,黄超,彭江平;具有双时间维约束的股票序列模式挖掘[J];计算机工程;2003年20期
10 许兆新,郝燕玲;约束在序列模式挖掘中的应用研究[J];计算机工程与应用;2004年05期
中国重要会议论文全文数据库 前10条
1 吕静;陈未如;刘俊;Osei Adjei;;并发分支模式挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 端义锋;胡谷雨;丁力;;序列模式挖掘在网络告警分析中的应用[A];2004年全国通信软件学术会议论文集[C];2004年
3 朱辉生;李存华;;序列模式挖掘的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 李润恒;贾焰;金鑫;;一种面向网络安全的序列模式挖掘方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 李晟;姜青山;郭顺;王备战;;一种优化的蛋白质序列模式挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
8 任家东;解玉洁;何海涛;张爱国;;基于改进前缀树PStree的最大序列模式挖掘[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
9 牛兴雯;杨冬青;唐世渭;王腾蛟;;OSAF-tree——可迭代的移动序列模式挖掘及增量更新方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 张锐;熊峗;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
中国博士学位论文全文数据库 前7条
1 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年
2 谢飞;带有通配符的序列模式挖掘研究[D];合肥工业大学;2011年
3 熊峗;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
4 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
5 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年
6 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
7 徐前方;基于数据挖掘的网络故障告警相关性研究[D];北京邮电大学;2007年
中国硕士学位论文全文数据库 前10条
1 张长海;分布式序列模式挖掘算法研究[D];扬州大学;2008年
2 陈晓;基于模糊集的序列模式挖掘研究[D];天津大学;2007年
3 俞单庆;序列模式挖掘及其在入侵检测中的应用研究[D];南京师范大学;2008年
4 杨名时;加权负序列模式挖掘算法研究[D];齐鲁工业大学;2015年
5 周慧霞;回归方法估算最长频繁模式长度研究[D];河北工业大学;2015年
6 冯建;基于命题逻辑的频繁序列模式挖掘算法的研究[D];浙江工业大学;2014年
7 廖清科;面向时间序列相似性的序列模式挖掘及应用[D];重庆交通大学;2015年
8 周坤;一般周期间隙约束的序列模式挖掘[D];河北工业大学;2015年
9 向剑平;Web日志中序列模式挖掘算法的研究[D];重庆大学;2015年
10 董鑫;时序数据序列模式挖掘[D];南京航空航天大学;2015年
,本文编号:652709
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/652709.html