当前位置:主页 > 科技论文 > 搜索引擎论文 >

一种数据流突变点快速探测算法的研究与实现

发布时间:2020-06-18 17:18
【摘要】:数据已经成为与自然资源、人力资源一样重要的战略资源,数据中隐藏着巨大的价值。大数据具有体量浩大、模态繁多、生成快速和价值巨大等特点。数据流中的时序数据分析是大数据研究的重要分支。数据流分析技术就是从各种类型繁多的数据中快速获得有价值的信息。数据流及其应用的迅速发展不仅促进基础科学的发展,更是许多行业技术进步、国家创新和产业发展的重要机遇和挑战。数据流的突变指的是当前时刻数据流的值相比于之前的数据流的值或者是数据流的平均值差值比较大。目前的数据流中突变点检测的分析方法大多很耗时,且对两端的突变点检测不准确等问题。本文引入了HWKS算法,该方法能够快速的检测到数据中的突变点,并做了对比验证。在该算法的基础上,引入了滑动窗口,以实现数据的在线检测,并通过模拟的数据验证了该方法的有效性。此外,通过实际火灾发生时的温度、烟雾浓度、CO和CO_2数据验证了该方法能够及时的检测到火灾的发生。HWKS算法是在Haar小波变换理论和改进的KS统计检验理论的基础上提出的。HWKS算法主要针对的是数据流中的时序模型数据,该算法的主要步骤是先应用多级Haar小波变换分解待检测的数据流,同时构建均值二叉树和差值二叉树。然后,在改进的KS统计的基础上,构建两种突变点检测的两个搜索规则,规则一是基于差值二叉搜索树,规则二是基于均值二叉搜索树,当规则一搜索不到突变点时,则采用规则二进行搜索,所以这两种规则是相互补充。最后,根据此规则进行突变点的检测。该算法采用自顶向下的搜索策略,并且以折半的思想进行查找,大大提高了检测的效率。本文通过仿真数据,将HWKS算法与KS检验、Haar小波和t检验三种方法从耗时、命中率、误差以及准确度四个方面进行了比较,验证了HWKS算法在算法效率、准确性和敏感性方面有明显的优势。为了应对数据流实时的特性,本文在HWKS算法的基础上,引入滑动窗口模型。通过仿真分析,探讨数据流的大小不变,滑动窗口尺寸的改变的情况下对数据流上突变点检测的影响。实验结果表明,滑动窗口越大检测到的突变点的位置越准确,但是滑动窗口也不是越大越好,还应考虑数据流的流速问题和数据流中有多个突变点的情况,为了验证HWKS算法对数据流中两端突变点的敏感性,本次仿真将突变点设置在数据流的起始位置和结束位置。实验结果表明,引入滑动窗口模型后,HWKS算法不仅对于数据边缘的突变点的检测仍然有很好的效果,同时也能够准确的探测出数据流中的所有的突变的。最后,本文通过模拟真实的火灾发生时的温度数据、烟雾浓度数据、CO浓度数据和CO_2浓度数据,运用带滑动窗口的HWKS算法和不带滑动窗口的HWKS算法进行了对比试验。实验结果表明引入滑动窗口后的HWKS算法不仅能够检测到火灾发生时的特征变化,同时也能检测出火灾后,这些特征的变化。此外,对于加入滑动窗口模型的HWKS算法比没有引入滑动窗口的HWKS算法要准确,所以该算法对火灾的探测有很好实际意义。
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP311.13
【图文】:

示意图,Haar小波,示意图,快速探测


一种数据流突变点快速探测算法的研究与实1,2 1,2 1, 2, 2,3,..., log2k j k jk jcA cAcA k N (1,2 1,2 1, 2-, 2,3,..., log2k j k jk jcA cAcD k N (过 k 级 Haar 分解后可以获得 k 级近似分量kcA 和 k 级细节分2 3, ,...,k cD cD ,2k 1, 2,3,..., logN,即1 2 1Z (cA cD cD ... cD cD )kH k k k (中,cA 和 cD 分别为均值和差值参数。时序数据 Z 进行多级小波变换下图所示。

示意图,搜索规则,突变点,示意图


序数据会带来不同,那么其累积经验 ) ( ))j C 也同时成节点对应数据里存在据中存在突变点,那个选出来,并选择该结点起向下逐层选索路径。而且,这使一选择突变点路径孩子结点对应的时值的那条支路。其中规则一失效则 A_p ,

【相似文献】

相关期刊论文 前10条

1 陈磊松;林锦贤;;面向高速网络的数据流处理模型研究[J];漳州师范学院学报(自然科学版);2006年02期

2 李斌;数据流处理自动化和重新设计[J];管理科学文摘;1997年05期

3 王文敏;方滨兴;胡铭曾;;逻辑程序设计语言的数据流并行计算模型研究[J];哈尔滨电工学院学报;1989年02期

4 David P.Misunas ,张启瑞;数据流处理机的性能分析[J];计算机工程与应用;1980年12期

5 陈付梅;韩德志;毕坤;戴永涛;;大数据环境下的分布式数据流处理关键技术探析[J];计算机应用;2017年03期

6 程小辉;肖富元;饶建辉;李泽球;;基于局域网的自适应修复的高可用数据流处理[J];计算机工程与设计;2011年07期

7 宫学庆;闫莺;常建龙;张晨;周傲英;;数据流处理技术在电信网管系统中的应用[J];计算机科学与探索;2008年02期

8 李俊奎;王元珍;;可重写循环滑动窗口:面向高效的在线数据流处理[J];计算机科学;2007年12期

9 牟柳晨,殷国富,廖敏;带传动远程设计系统的数据流处理方法[J];计算机应用;2004年S1期

10 山蕊;李涛;蒋林;;动态可重构阵列处理器数据流处理单元的设计与实现[J];微电子学与计算机;2017年01期

相关会议论文 前5条

1 韩近强;杨冬青;唐世渭;;数据流处理中一种自适应的直方图维护算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年

2 楚红涛;寒枫;张燕;王婷;;基于数据流的挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年

3 刘英杰;朱科军;赵京伟;;BESIII事例筛选软件中的备用机制[A];第13届全国计算机、网络在现代科学技术领域的应用学术会议论文集[C];2007年

4 曹辉;巨新刚;于飞;;面向在轨信息处理的多层次紧耦合处理器设计和应用[A];航天电子军民融合论坛暨第十四届学术交流会优秀论文集(2017年)[C];2017年

5 姜文红;;Linux系统中IPsec协议数据流处理方式的研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年

相关重要报纸文章 前1条

1 李勇;降低投资70%[N];中国计算机报;2003年

相关博士学位论文 前10条

1 任思琪;基于概念漂移的数据流集成分类算法研究[D];湖南大学;2018年

2 金澈清;数据流上若干查询处理算法的研究[D];复旦大学;2005年

3 王金栋;数据流系统中负载管理技术应用研究[D];南京航空航天大学;2006年

4 陈安龙;多数据流处理的关键技术研究[D];四川大学;2006年

5 单世民;基于网格和密度的数据流聚类方法研究[D];大连理工大学;2006年

6 刘学军;数据流聚集查询和频繁模式挖掘的研究[D];东南大学;2006年

7 王永利;数据流概要与数据流分析若干关键问题研究[D];东南大学;2006年

8 钱江波;连续查询硬处理器及相关算法研究[D];东南大学;2006年

9 曹锋;数据流聚类分析算法[D];复旦大学;2006年

10 崇志宏;基于屏蔽/汇总技术的数据流处理算法[D];复旦大学;2006年

相关硕士学位论文 前10条

1 宋巧红;一种数据流突变点快速探测算法的研究与实现[D];东华大学;2018年

2 魏星贝;基于时间关联性的数据流乱序处理技术[D];广西大学;2018年

3 韩杰;基于集成学习的数据流分类算法研究[D];合肥工业大学;2018年

4 张旭旭;基于主动学习的数据流分类器研究[D];湖南大学;2017年

5 丛义昊;基于数据流的分布式实时推荐算法的研究与实现[D];北京邮电大学;2018年

6 周利朋;广告交易平台的设计与实现[D];山东大学;2018年

7 郭旭;面向数据流的频繁模式挖掘算法研究[D];天津工业大学;2018年

8 牛丽媛;基于Storm的分布式数据流密度聚类算法的研究[D];天津师范大学;2018年

9 周飞杰;SDN中快速流分类策略及自适应路由算法研究[D];郑州大学;2018年

10 崔泽林;基于密度网格的数据流聚类和概念漂移检测算法研究[D];北京交通大学;2017年



本文编号:2719584

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2719584.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户84cef***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com