基于u-shapelets的时间序列聚类方法及其在空气质量分析中的应用

发布时间:2021-07-02 18:46
  随着互联网技术的迅速发展,数据呈指数增长,这些数据大多以时间序列形式存在,所以面向时间序列数据的挖掘技术与方法受到了广泛的重视。由于时间序列数据存在海量性、高维性、噪声大等特点,直接使用传统聚类方法很难准确地将对其进行划分。而基于u-shapelets的时间序列聚类方法使用局部有辨识度的特征以区别时间序列间的差异,该方法不仅避免了噪声对聚类带来的影响,还有助于提高传统聚类方法对时间序列数据进行聚类的精度和效率。为此,本文分析了基于u-shapelets时间序列聚类方法及其局限性,同时针对准确度低、时间复杂度高、数据类型多样三个方面进行改进,并将改进方法应用到我国362个城市空气质量等级进行划分中,用以寻找污染严重区域。本文的主要工作可以归纳如下:(1)针对单特征时间序列聚类分析,提出了基于DTW的u-shapelets单特征聚类方法。首先,该方法随机选取全部子序列的1%作为候选集,解决了提取最佳u-shapelets集合时间消耗大的问题;其次,计算子序列间的质量评估时,选用DTW距离计算改进分离度的计算,提高选取最佳u-shapelets集合的质量,基于最佳u-shapelets集合进... 

【文章来源】:大连海事大学辽宁省 211工程院校

【文章页数】:74 页

【学位级别】:硕士

【部分图文】:

基于u-shapelets的时间序列聚类方法及其在空气质量分析中的应用


图1.2两个时间序列局部形状差异??Fig.?1.2?Local?shape?difference?between?two?time?series??关于时间序列分析一直是理论研宄的热门话题

组织结构图,组织结构图,论文,聚类


?大连海事大学硕士学位论文???Ji??—????研萌is莒义囯内冊麵?131作??相觸歐?办??时间解纖及綱亡??特征?相W性度31?聚类方;去??基于U*pe刚聊腦?O??酬li挪1%作为麵???????—??DTW-u-shapeletsClus?一????1?基于01奴距商的分商度S????u-shapeletsl???*?▲现有方法峨分??取方法?■???|???枬????P_?? ̄?—?PCA-pu-shapeletsMTSC?一??Pearson相綠数????时ial)?p^Sn^析中輕?V????PM2?S、PM10,?S02,?CO,?N02,?03使用??DTW.u-shapeletsCkjs?方紛?8J?分析??染激i准f!?????^?、聚类结鞋可??麵示???I?5啼5?飯?SlPCA-pu-shapeletsMTSC?方趣体分桁?|___??,';S|-;-.?^V7??致总结?鴨赛望??图1.3论文组织结构图??Fig.?1.3?Thesis?organization?chart??9??

曲线,时间序列,曲线,序列


度,提升时间序列计算速度,尽可能的节省计??算成本M。本节是对时间序列以及时间序列特征方法进行介绍。??2.1.1时间序列??数据挖掘是近年来发展迅速的一门交叉学科,它涉及了统计学、数据库、神经网络、??机器学习等热门领域的理论研究,需要对以往的大量数据进行统计、分析,从中得到未??知的、隐含的、有价值的信息。时间序列是按照时间顺序得到的一系列连续数据值的集??合,是一种重要又常见的数据类型,在经济、医疗、商业、科技等领域都普遍存在。时??间序列通常有曲线表现形式和序列表现形式,如图2.1所示。以下将对时间序列的数学??定义[4;进行介绍。??3????2.5?_??2??1.5??1?二??^???0-5??0????????0?50?1?00?1?50?20C???sjfB]r^i3?-?BfW序列3??图2.?1时间序列曲线??Fig?.2.1?Time?series?curve??10??

【参考文献】:
期刊论文
[1]基于最佳u-shapelets的时间序列聚类算法[J]. 余思琴,闫秋艳,闫欣鸣.  计算机应用. 2017(08)
[2]环境污染、经济增长与医疗卫生服务对公共健康的影响分析——基于中国省际面板数据的研究[J]. 曲卫华,颜志军.  中国管理科学. 2015(07)
[3]基于BIRCH算法的模糊集数据库挖掘算法[J]. 张蓉,钟艳.  科技通报. 2014(04)
[4]基于灰色聚类方法的城市空气质量分析[J]. 夏亚荣.  西安文理学院学报(自然科学版). 2013(04)
[5]数据挖掘中适用于分类的时序数据特征提取方法[J]. 林珠,邢延.  计算机系统应用. 2012(10)
[6]厦门市能源消费对环境及公共健康影响研究[J]. 周健,崔胜辉,林剑艺,李飞.  环境科学学报. 2011(09)
[7]我国113个城市大气颗粒物污染的健康经济学评价[J]. 陈仁杰,陈秉衡,阚海东.  中国环境科学. 2010(03)
[8]基于序列重要点的时间序列分割[J]. 周大镯,李敏强.  计算机工程. 2008(23)
[9]数据挖掘中的聚类算法综述[J]. 贺玲,吴玲达,蔡益朝.  计算机应用研究. 2007(01)
[10]上海市大气气态污染物与居民每日死亡关系的时间序列研究[J]. 宋桂香,江莉莉,陈国海,陈秉衡,张蕴晖,赵耐青,蒋颂辉,阚海东.  环境与健康杂志. 2006(05)

硕士论文
[1]时间序列聚类中U-shapelets提取方法的研究[D]. 孟庆红.华东师范大学 2018
[2]时间序列的特征表示与聚类方法研究[D]. 熊英志.重庆大学 2016
[3]基于密度的层次聚类算法研究[D]. 张文开.中国科学技术大学 2015



本文编号:3261021

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3261021.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4bf97***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com