基于特征的时间序列聚类
本文关键词:基于特征的时间序列聚类
【摘要】:时间序列数据挖掘作为数据挖掘的重要分支,其挖掘的对象是特定的,即为时间序列。不同于传统的静态数据,时间序列是一种复杂的数据对象,描述事物的变化过程。而时间序列是无处不在的,如股票价格数据、图像数据和文本数据等都可以看作为时间序列。作为数据挖掘的一个分支,时间序列数据挖掘研究主要有以下几个方面:时间序列相似性搜索、时间序列聚类、时间序列分类、时间序列分割与模式发现、海量时间序列可视化和时间序列预测等。本文探讨一种特定的时间序列聚类,即基于特征的时间序列聚类。 本文首先对时间序列挖掘、时间序列聚类以及基于特征的时间序列聚类做了一个总体的介绍;其次,对时间序列的特征和时间序列的相似性度量作了一个总体的概述;然后,根据已有的算法,提出一种改进的基于关键点提取压缩维度的时间序列模糊聚类算法newFCM (new fuzzy C-means),以及在newFCM算法基础上的时间序列动态聚类算法Dyn-Clustering。newFCM算法通过提取时间序列中的波峰、波谷或转折点作为时间序列的关键点构成关键点序列来表征原来的时间序列,以达到降维和去除噪声的目的,同时采用兰氏距离克服算法对奇异值敏感的缺点,并调整兰氏距离,使其更准确地度量我们的关键点序列间的相似度。更进一步,引入基于基本统计特征的相似度度量,来克服算法不能发现平移或拉伸的时间序列的相似性的缺点。 本文进一步介绍了聚类效果度量标准,并利用这些度量标准从多方面对所提改进算法进行实验评估。首先,对newFCM算法进行了参数评测实验;然后,与传统的FCM算法和K-means算法作对比,进行性能对比实验;最后,利用newFCM和Dyn-Clustering对20只国内商品期货的价格和成交量序列进行实际应用分析。实验表明,用newFCM算法对时间序列进行聚类,聚类效果良好,效率更高。在实际应用中,用newFCM算法对时间序列进行聚类,对于类别不是很明显的时间序列,Dyn-Clustering算法能够根据不同的时间段将其聚类到不同类别中,实现对时间序列的动态聚类,由此帮助人们进一步理解时间序列的动态演化性质,准确有效地把握其结构特征。特别的,对于金融时间序列,通过对时间序列动态聚类,可以有效动态的把握时间序列的趋势变化,以达到对时间序列趋势变化预测的目的。
【关键词】:时间序列 聚类 关键点 特征
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.13
【目录】:
- 摘要3-4
- Abstract4-8
- 第一章 绪论8-14
- 1.1 引言8
- 1.2 时间序列挖掘8-9
- 1.2.1 时间序列的定义8-9
- 1.2.2 时间序列挖掘的任务与内容9
- 1.3 时间序列聚类9-11
- 1.3.1 聚类9-10
- 1.3.2 时间序列聚类技术10-11
- 1.4 基于特征的时间序列聚类11-12
- 1.4.1 基于形态特征的时间序列聚类11
- 1.4.2 基于结构特征的时间序列聚类11-12
- 1.4.3 基于模型特征的时间序列聚类12
- 1.5 论文的主要工作和结构组织12-13
- 1.6 本章小结13-14
- 第二章 时间序列特征及其相似性度量14-19
- 2.1 引言14
- 2.2 时间序列类型14
- 2.3 时间序列特征14-16
- 2.3.1 形态特征14
- 2.3.2 结构特征14-16
- 2.3.3 模型特征16
- 2.4 相似性度量16-18
- 2.4.1 欧氏距离17
- 2.4.2 动态时间弯曲17
- 2.4.3 符号化距离17-18
- 2.4.4 其他距离度量方法18
- 2.5 本章小结18-19
- 第三章 基于关键点的时间序列模糊聚类及动态聚类19-30
- 3.1 引言19
- 3.2 关键点19-21
- 3.2.1 关键点定义19-20
- 3.2.2 关键点提取20-21
- 3.3 改进的FCM算法21-27
- 3.3.1 距离度量21-25
- 3.3.2 算法框架25-26
- 3.3.3 算法步骤26-27
- 3.4 动态聚类算法27-28
- 3.5 本章小结28-30
- 第四章 基于关键点的时间序列聚类实验评估与应用30-44
- 4.1 引言30
- 4.2 实验介绍30
- 4.3 对比算法介绍30-31
- 4.3.1 K-means算法30-31
- 4.3.2 FCM算法31
- 4.4 聚类结果评估标准31-33
- 4.5 实验与分析33-39
- 4.5.1 算法参数调整实验33-37
- 4.5.2 对比实验37-39
- 4.6 对20国内商品期货的聚类39-43
- 4.6.1 数据介绍39-41
- 4.6.2 聚类结果与分析41-43
- 4.7 本章小结43-44
- 第五章 全文总结与展望44-46
- 5.1 全文总结44
- 5.2 展望44-46
- 参考文献46-49
- 附件49-66
- 附件1:对原始数据进行压缩求关键点序列的cutData函数代码49-51
- 附件2: 改进的FCM算法代码,即newFCM51-55
- 附件3: 计算任意一个聚类结果的准确率R的函数代码55-57
- 附近4: 计算任意一个聚类结果的NMI函数代码57-59
- 附件5:k-means算法代码59-63
- 附件6:动态聚类Dyn_Clustering算法代码63-66
- 致谢66-67
【相似文献】
中国期刊全文数据库 前10条
1 冯凯文;孟凡荣;牛强;闫秋艳;;基于趋势点状态模型的时间序列预测算法[J];计算机应用研究;2011年12期
2 周大镯;李敏强;;基于序列重要点的时间序列分割[J];计算机工程;2008年23期
3 董云耀;杨望书;;基于时间序列趋势模型的研究与应用[J];杭州电子科技大学学报;2008年01期
4 李海林;郭崇慧;;基于云模型的时间序列分段聚合近似方法[J];控制与决策;2011年10期
5 宫正;刘晓燕;;时间序列短期趋势信号模型研究[J];计算机技术与发展;2011年12期
6 曹文平;罗颖;熊启军;宁彬;;基于二次回归的时间序列分割算法[J];计算机光盘软件与应用;2012年18期
7 胡家元;;运用时间序列辨识方法实现卡尔曼式自适应天线[J];电波科学学报;1988年01期
8 林雪梅;;一种用于模拟胶函数检测和肌力估计的多通道时间序列肌处理器的理论研究[J];国外医学.生物医学工程分册;1990年05期
9 陈远;王菲菲;;基于时间序列的电子商务市场预测系统研发[J];情报科学;2009年12期
10 孙兵;刘雯;田地;宋桐;富妍;;基于时间序列的数据挖掘在证券中的应用[J];吉林大学学报(信息科学版);2010年03期
中国重要会议论文全文数据库 前10条
1 周家斌;张海福;杨桂英;;多维多步时间序列预报方法及其应用[A];中国现场统计研究会第九届学术年会论文集[C];1999年
2 马培蓓;纪军;;基于时间序列的航空备件消耗预测[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年
3 卢世坤;李夕海;牛超;陈蛟;;时间序列的非线性非平稳特性研究综述[A];国家安全地球物理丛书(八)——遥感地球物理与国家安全[C];2012年
4 李强;;基于线性模型方法对时间序列中异常值的检测及证券实证分析[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年
5 戴丽金;何振峰;;基于云模型的时间序列相似性度量方法[A];第八届中国不确定系统年会论文集[C];2010年
6 谢美萍;赵希人;庄秀龙;;多维非线性时间序列的投影寻踪学习逼近[A];'99系统仿真技术及其应用学术交流会论文集[C];1999年
7 张大斌;李红燕;刘肖;张文生;;非线性时问序列的小波-模糊神经网络集成预测方法[A];第十五届中国管理科学学术年会论文集(下)[C];2013年
8 黄云贵;;基于时间序列的电网固定资产投资规模研究[A];2012年云南电力技术论坛论文集(文摘部分)[C];2012年
9 李松臣;张世英;;时间序列高阶矩持续和协同持续性研究[A];21世纪数量经济学(第8卷)[C];2007年
10 陈赫;罗声求;;历史横断面数据的时间序列化[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
中国重要报纸全文数据库 前7条
1 ;《时间序列与金融数据分析》[N];中国信息报;2004年
2 何德旭 王朝阳;时间序列计量经济学:协整与有条件的异方差自回归[N];中国社会科学院院报;2003年
3 刘俏;让数据坦白真相[N];21世纪经济报道;2003年
4 西南证券高级研究员 董先安邋德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年
5 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
6 任勇邋郑重;中国对世界钢材价格的影响实证分析[N];现代物流报;2007年
7 房鹏;数码书信寄真情[N];中国电脑教育报;2005年
中国博士学位论文全文数据库 前10条
1 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年
2 李桂玲;时间序列的分割及不一致发现研究[D];华中科技大学;2012年
3 周勇;时间序列时序关联规则挖掘研究[D];西南财经大学;2008年
4 张勇;时间序列模式匹配技术研究[D];华中科技大学;2012年
5 董晓莉;时间序列数据挖掘相似性度量和周期模式挖掘研究[D];天津大学;2007年
6 姜向荣;短时间序列预测建模及应用研究[D];北京邮电大学;2009年
7 许娜;时间序列的分形及其混沌分析[D];北京交通大学;2011年
8 李新杰;河川径流时间序列的非线性特征识别与分析[D];武汉大学;2013年
9 甘敏;基于状态相依模型的非线性时间序列建模及其优化方法研究[D];中南大学;2010年
10 何晓旭;时间序列数据挖掘若干关键问题研究[D];中国科学技术大学;2014年
中国硕士学位论文全文数据库 前10条
1 杨宇鹏;基于时间序列的数据预测问题研究[D];吉林大学;2010年
2 张振;基于重要点模式的时间序列表示及其应用[D];昆明理工大学;2010年
3 卓明坤;时间序列短期趋势信号模型研究[D];昆明理工大学;2011年
4 毛兴;阶梯型时间序列时域分析及应用[D];武汉科技大学;2011年
5 董燕;近邻数限制下的时间序列网络分析[D];华东师范大学;2012年
6 田雯;火灾时间序列的动力学研究及其预测[D];南昌大学;2012年
7 李迎;时间序列聚类方法研究[D];辽宁师范大学;2012年
8 陈思扬;时间序列计量经济建模技术及比较研究[D];暨南大学;2007年
9 郑继萍;时间序列的相似性挖掘及其在股票时间序列中的应用[D];东北财经大学;2007年
10 王娜;时间序列建模预报的原理与应用[D];长春工业大学;2010年
,本文编号:1064694
本文链接:https://www.wllwen.com/jingjilunwen/qihuoqq/1064694.html