单时间序列异常子序列检测算法的研究
本文关键词:单时间序列异常子序列检测算法的研究
更多相关文章: 单时间序列 异常子序列 HOT SAX k近邻
【摘要】:随着信息技术的快速发展,数据的种类越来越多且数据规模越来越大,而时间序列是其中一种很重要的数据形式。从时间序列数据中寻找出异常极具意义,例如检测异常心电数据、异常传感器数据等。时间序列异常有时不仅仅是数据点异常,而是连续一段数据即子序列异常,本文研究的就是单时间序列中异常子序列的检测。单时间序列异常子序列检测方法主要有基于模型的方法及基于比较的方法。基于比较的方法相比基于模型的方法来说,其思想简单直观,设置参数少,无需训练模型,算法适用范围更广。当前基于比较的方法一般通过寻找与其余子序列最不相似的子序列来进行异常子序列的检测。其中典型高效的算法就是HOT SAX(Hot Symbolic Aggregate Approximation)算法。基于比较的方法具有许多优点,但一些问题仍需解决改善,本文就是在基于比较的算法的基础上进行的异常子序列检测研究。本文在基于比较的方法框架下,提出利用子序列最小边界矩形比特化表示的聚类结果来启发异常子序列的搜索顺序,从而提高异常子序列检测的效率。考虑到原异常子序列定义不能发现相似异常的缺点,改进异常子序列的定义,采用基于k近邻的异常子序列定义,并在此定义下提出高效的异常子序列检测算法来寻找异常子序列。实际应用中有时需要检测前若干个异常,本文同时提出了检测前若干个最异常子序列的算法。时间序列数据通常是源源不断更新的,将时间序列异常子序列检测算法运用到动态时间序列数据流中进行异常子序列在线检测更具实际应用价值,本文通过深入分析时间序列数据流特点,将新定义下的异常子序列检测算法框架运用到时间序列数据流中,提出了高效的异常子序列在线检测算法以适应时间序列数据流。通过将本文提出的算法运用到模拟数据集和实际数据集中进行验证,实验结果表明,算法是有效的,且获得了较高的效率。
【关键词】:单时间序列 异常子序列 HOT SAX k近邻
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13;O211.61
【目录】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 绪论8-14
- 1.1 研究背景与意义8-9
- 1.2 国内外研究现状9-12
- 1.2.1 时间序列相关研究9-11
- 1.2.2 异常子序列检测研究现状11-12
- 1.3 本文的主要内容12-13
- 1.4 章节结构安排13-14
- 第2章 异常子序列检测研究基础14-21
- 2.1 基本定义14-16
- 2.2 时间序列表示及相似性度量16-19
- 2.3 HOT SAX算法19-20
- 2.4 本章小结20-21
- 第3章 异常子序列检测方法研究21-40
- 3.1 异常子序列检测算法MTSAD21-26
- 3.1.1 最小边界矩形表示比特化22-24
- 3.1.2 聚类启发异常子序列检测算法24-26
- 3.2 异常子序列检测算法KTSAD及TOPNKTSAD26-32
- 3.2.1 基于KNN的异常子序列定义26-27
- 3.2.2 异常子序列检测算法KTSAD27-29
- 3.2.3 检测前N个异常子序列算法TOPNKTSAD29-32
- 3.3 异常子序列在线检测32-39
- 3.3.1 缓冲区异常子序列检测算法EOTSAD33-37
- 3.3.2 真实异常的判定37-39
- 3.4 本章小结39-40
- 第4章 实验结果与分析40-53
- 4.1 实验环境与数据集简介40-41
- 4.2 算法有效性验证与分析41-47
- 4.2.1 合成数据集验证与分析41-44
- 4.2.2 真实数据集验证与分析44-47
- 4.3 算法效率验证与分析47-52
- 4.3.1 异常子序列检测效率验证及对比47-50
- 4.3.2 TOPNKTSAD检测效率验证分析50-51
- 4.3.3 EOTSAD检测效率验证分析51-52
- 4.4 本章小结52-53
- 结论53-54
- 参考文献54-59
- 致谢59
【相似文献】
中国期刊全文数据库 前10条
1 罗辽复;蔡禄;;一个分子序列的进化模型[J];内蒙古大学学报(自然科学版);1989年03期
2 张立震,唐焕文;一种基于子序列分布的蛋白质结构类预测方法[J];计算机与应用化学;2003年03期
3 罗辽复,特木尔巴根;分子序列进化方程的解的研究[J];内蒙古大学学报(自然科学版);1994年05期
4 于海英;赵俊岚;;最长公共子序列算法在程序代码相似度度量中的应用[J];内蒙古大学学报(自然科学版);2008年02期
5 业宁;朱大铭;张倩倩;沈丽容;;带约束最长公共子序列快速算法[J];南京大学学报(自然科学版);2009年05期
6 李绍宽;关于Fredholm算子序列[J];数学年刊A辑(中文版);1988年06期
7 陈占宽,袁晓东,陈新建,JOY Fleming,郅玉宝,易明林;小麦醇溶蛋白盒结合因子基因启动子序列(英文)[J];植物生理与分子生物学学报;2002年01期
8 陈军营,温付喜,陈新建,程西永,许海霞;小麦类发芽素蛋白3启动子序列(登录号:AY864922)(英文)[J];分子植物育种;2005年06期
9 罗辽复;;分子序列告诉我们什么?——构象功能和进化[J];内蒙古大学学报(自然科学版);1988年03期
10 石少广;田立新;;Banach空间上的非游荡算子序列[J];江苏大学学报(自然科学版);2005年S1期
中国重要会议论文全文数据库 前5条
1 赵丽丽;王建波;杨会杰;;人类启动子序列的复杂性[A];数学·力学·物理学·高新技术交叉研究进展——2010(13)卷[C];2010年
2 刘维;陈];;基于剪枝跳跃技术的最长公共子序列算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
3 柯琦;钟诚;李智;王刚强;;多核计算机上最大和子序列线程级并行算法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
4 倪晟宇;;在流数据模式下计算最长递增子序列长度[A];2005年全国理论计算机科学学术年会论文集[C];2005年
5 苗玉发;李波;;CMV启动子序列检测的复合实时定量PCR方法的建立[A];中国毒理学会第六届全国毒理学大会论文摘要[C];2013年
中国重要报纸全文数据库 前4条
1 ;编程沙龙[N];电脑报;2003年
2 PALADIN;编程沙龙[N];电脑报;2003年
3 PALADIN;编程沙龙[N];电脑报;2003年
4 信息产业部电信设备认证中心 周冉;分子序列压缩:提高广域网效率的利器[N];通信产业报;2006年
中国博士学位论文全文数据库 前2条
1 王树林;生物子序列频数分布与肿瘤亚型分类模型研究[D];国防科学技术大学;2007年
2 孙芳;零和自由序列的子序列和问题[D];南开大学;2010年
中国硕士学位论文全文数据库 前4条
1 肖鹏;单时间序列异常子序列检测算法的研究[D];哈尔滨工业大学;2016年
2 赵晓燕;基于多索引的高维时间序列子序列检索研究[D];大连理工大学;2010年
3 朱鹤;结果分级的快速子序列相似查询方法研究[D];燕山大学;2010年
4 高鸿远;基于子序列匹配的压缩XML查询[D];哈尔滨工业大学;2009年
,本文编号:626750
本文链接:https://www.wllwen.com/kejilunwen/yysx/626750.html