面向聚类及预测的时间序列信息粒化方法研究
发布时间:2021-06-21 12:16
随着信息技术的发展,经济管理领域中产生并存储着大量的时间序列数据,运用数据挖掘算法可以挖掘出数据中潜在的、有价值的知识和信息以支持管理和决策活动。但这些时间序列数据通常都具有显著的高维性特征,若对其直接运用数据挖掘算法,会造成过高的计算复杂度,且数据挖掘结果也会受到影响。粒计算是一种模拟人类求解问题思维和解决大数据复杂任务的新方法,该理论的主要思想是将复杂问题抽象、划分转化为若干较为简单的问题(即粒化),从而有助于更好的分析和解决问题。本文将粒计算的粒化思想引入时间序列分析中,通过对时间序列进行信息粒化,将原始高维时间序列粒化为低维粒时间序列,构造的信息粒能够刻画和反映原始时间序列数据的结构特征,从而实现高效降维,为后续的数据挖掘工作奠定基础。本文针对时间序列的信息粒化问题,从时间轴和论域两个方面提出了三种不同的时间序列信息粒化方法:基于波动点的时间序列时间轴信息粒化方法、基于云模型的时间序列时间轴信息粒化方法和基于论域信息粒化的模糊时间序列预测方法,并应用于股票时间序列数据进行聚类和预测分析,为股票的投资选股问题及涨跌趋势的判断问题提供决策建议。主要研究内容和创新性研究成果如下:(1...
【文章来源】:北京科技大学北京市 211工程院校 教育部直属院校
【文章页数】:164 页
【学位级别】:博士
【部分图文】:
图2-1?PLA示例??
分段序列的均值来表示原始时间序列特征的方法。??PAA将长度为w的时间序列平均分为w段,每段序列具有相同的长度々,并??且利用每段序列的均值来近似表示该序列段,其压缩比为bwAv。PAA中特??征序列的确定依赖于降维数us?w越小,则PAA表示时间序列越粗糖,将会??丢失更多的信息;相反,w越大,近似表示就越准确。因此,选择合适的w??很重要。??小??!?:??>,、、、??卜7^?T'??,广 ̄L-X_??i?i?\??/?|?|?、???;?;;?>??图2-2?PAA示例??PAA有以下优点:可以快速地计算;支持任意长度的查找;支持非??Euclidean距离的度量方法;支持权重的Euclidean距离度量;表示方法简单、??直观。由于PAA中的分段是固定长度,虽然方便了索引,但造成了表示的不??准确性。??③自适应分段常量近似??在PAA方法的基础上,Keogh等人又提出了适用于各部分长度任意的自??适应分段常量近似(AdaptivePiecewiseConstantApproximation,?APCA)方法??[251。该方法可以根据时间序列自身特征进行不等长的序列分段,同样利用均??值描述对应序列段的特征。这种方法每个部分都需要记录两个数字,分别记??录该部分内所有数据点的平均值和这部分的长度。??小???,?:??i?,「,、、、??产>、?I ̄、、、??—, ̄V-??TH?M?\??4?:?i?i???:?;?!?>??图2-3?APCA示例??-12?-??
分段序列的均值来表示原始时间序列特征的方法。??PAA将长度为w的时间序列平均分为w段,每段序列具有相同的长度々,并??且利用每段序列的均值来近似表示该序列段,其压缩比为bwAv。PAA中特??征序列的确定依赖于降维数us?w越小,则PAA表示时间序列越粗糖,将会??丢失更多的信息;相反,w越大,近似表示就越准确。因此,选择合适的w??很重要。??小??!?:??>,、、、??卜7^?T'??,广 ̄L-X_??i?i?\??/?|?|?、???;?;;?>??图2-2?PAA示例??PAA有以下优点:可以快速地计算;支持任意长度的查找;支持非??Euclidean距离的度量方法;支持权重的Euclidean距离度量;表示方法简单、??直观。由于PAA中的分段是固定长度,虽然方便了索引,但造成了表示的不??准确性。??③自适应分段常量近似??在PAA方法的基础上,Keogh等人又提出了适用于各部分长度任意的自??适应分段常量近似(AdaptivePiecewiseConstantApproximation,?APCA)方法??[251。该方法可以根据时间序列自身特征进行不等长的序列分段,同样利用均??值描述对应序列段的特征。这种方法每个部分都需要记录两个数字,分别记??录该部分内所有数据点的平均值和这部分的长度。??小???,?:??i?,「,、、、??产>、?I ̄、、、??—, ̄V-??TH?M?\??4?:?i?i???:?;?!?>??图2-3?APCA示例??-12?-??
【参考文献】:
期刊论文
[1]基于趋势转折点边界面积的时间序列分段算法[J]. 汤晶晶,李晋宏. 软件. 2019(12)
[2]基于模糊信息粒化和长短期记忆网络的短期风速预测[J]. 殷豪,黄圣权,刘哲,孟安波,杨跞. 电测与仪表. 2019(11)
[3]基于深度学习支持向量机的上证指数预测[J]. 张晶华,甘宇健. 统计与决策. 2019(02)
[4]基于模糊信息粒化和支持向量机的股票价格回归预测[J]. 郑明,李娌芝,官心果,杨柱元. 云南民族大学学报(自然科学版). 2018(06)
[5]基于模糊信息粒化与马尔科夫修正的瓦斯浓度预测[J]. 武艳蒙,邱春荣,吕晓波. 煤炭技术. 2018(05)
[6]时间序列数据趋势转折点提取算法[J]. 邢邗,石晓达,孙连英,葛娜. 计算机工程. 2018(01)
[7]正态云模型研究回顾与展望[J]. 杨洁,王国胤,刘群,郭毅可,刘悦,淦文燕,刘玉超. 计算机学报. 2018(03)
[8]基于多维时间序列形态特征的相似性动态聚类算法[J]. 王玲,孟建瑶,徐培培,彭开香. 工程科学学报. 2017(07)
[9]农产品价格预测模型的构建[J]. 徐雅卿,魏轶华,李旭刚. 统计与决策. 2017(12)
[10]基于模糊信息粒化支持向量机的短期电力负荷预测[J]. 孔平,陈亮,马晶. 电力信息与通信技术. 2016(01)
博士论文
[1]时间序列的多粒度智能分析方法研究[D]. 邓伟辉.中国科学院大学(中国科学院重庆绿色智能技术研究院) 2017
[2]时间序列分类算法研究[D]. 原继东.北京交通大学 2016
[3]基于模糊理论的时间序列预测研究[D]. 王威娜.大连理工大学 2016
[4]基于粒计算的时间序列分析与建模方法研究[D]. 卢伟.大连理工大学 2015
[5]时间序列数据挖掘中的特征表示与相似性度量方法研究[D]. 李海林.大连理工大学 2012
硕士论文
[1]基于粒计算的区间值时间序列建模方法研究[D]. 周维.大连理工大学 2019
[2]基于多元粒时间序列的建模与预测研究[D]. 邵广豪.大连理工大学 2017
[3]不确定性时间序列的降维与相似性匹配研究[D]. 肖瑞.东华大学 2014
本文编号:3240659
【文章来源】:北京科技大学北京市 211工程院校 教育部直属院校
【文章页数】:164 页
【学位级别】:博士
【部分图文】:
图2-1?PLA示例??
分段序列的均值来表示原始时间序列特征的方法。??PAA将长度为w的时间序列平均分为w段,每段序列具有相同的长度々,并??且利用每段序列的均值来近似表示该序列段,其压缩比为bwAv。PAA中特??征序列的确定依赖于降维数us?w越小,则PAA表示时间序列越粗糖,将会??丢失更多的信息;相反,w越大,近似表示就越准确。因此,选择合适的w??很重要。??小??!?:??>,、、、??卜7^?T'??,广 ̄L-X_??i?i?\??/?|?|?、???;?;;?>??图2-2?PAA示例??PAA有以下优点:可以快速地计算;支持任意长度的查找;支持非??Euclidean距离的度量方法;支持权重的Euclidean距离度量;表示方法简单、??直观。由于PAA中的分段是固定长度,虽然方便了索引,但造成了表示的不??准确性。??③自适应分段常量近似??在PAA方法的基础上,Keogh等人又提出了适用于各部分长度任意的自??适应分段常量近似(AdaptivePiecewiseConstantApproximation,?APCA)方法??[251。该方法可以根据时间序列自身特征进行不等长的序列分段,同样利用均??值描述对应序列段的特征。这种方法每个部分都需要记录两个数字,分别记??录该部分内所有数据点的平均值和这部分的长度。??小???,?:??i?,「,、、、??产>、?I ̄、、、??—, ̄V-??TH?M?\??4?:?i?i???:?;?!?>??图2-3?APCA示例??-12?-??
分段序列的均值来表示原始时间序列特征的方法。??PAA将长度为w的时间序列平均分为w段,每段序列具有相同的长度々,并??且利用每段序列的均值来近似表示该序列段,其压缩比为bwAv。PAA中特??征序列的确定依赖于降维数us?w越小,则PAA表示时间序列越粗糖,将会??丢失更多的信息;相反,w越大,近似表示就越准确。因此,选择合适的w??很重要。??小??!?:??>,、、、??卜7^?T'??,广 ̄L-X_??i?i?\??/?|?|?、???;?;;?>??图2-2?PAA示例??PAA有以下优点:可以快速地计算;支持任意长度的查找;支持非??Euclidean距离的度量方法;支持权重的Euclidean距离度量;表示方法简单、??直观。由于PAA中的分段是固定长度,虽然方便了索引,但造成了表示的不??准确性。??③自适应分段常量近似??在PAA方法的基础上,Keogh等人又提出了适用于各部分长度任意的自??适应分段常量近似(AdaptivePiecewiseConstantApproximation,?APCA)方法??[251。该方法可以根据时间序列自身特征进行不等长的序列分段,同样利用均??值描述对应序列段的特征。这种方法每个部分都需要记录两个数字,分别记??录该部分内所有数据点的平均值和这部分的长度。??小???,?:??i?,「,、、、??产>、?I ̄、、、??—, ̄V-??TH?M?\??4?:?i?i???:?;?!?>??图2-3?APCA示例??-12?-??
【参考文献】:
期刊论文
[1]基于趋势转折点边界面积的时间序列分段算法[J]. 汤晶晶,李晋宏. 软件. 2019(12)
[2]基于模糊信息粒化和长短期记忆网络的短期风速预测[J]. 殷豪,黄圣权,刘哲,孟安波,杨跞. 电测与仪表. 2019(11)
[3]基于深度学习支持向量机的上证指数预测[J]. 张晶华,甘宇健. 统计与决策. 2019(02)
[4]基于模糊信息粒化和支持向量机的股票价格回归预测[J]. 郑明,李娌芝,官心果,杨柱元. 云南民族大学学报(自然科学版). 2018(06)
[5]基于模糊信息粒化与马尔科夫修正的瓦斯浓度预测[J]. 武艳蒙,邱春荣,吕晓波. 煤炭技术. 2018(05)
[6]时间序列数据趋势转折点提取算法[J]. 邢邗,石晓达,孙连英,葛娜. 计算机工程. 2018(01)
[7]正态云模型研究回顾与展望[J]. 杨洁,王国胤,刘群,郭毅可,刘悦,淦文燕,刘玉超. 计算机学报. 2018(03)
[8]基于多维时间序列形态特征的相似性动态聚类算法[J]. 王玲,孟建瑶,徐培培,彭开香. 工程科学学报. 2017(07)
[9]农产品价格预测模型的构建[J]. 徐雅卿,魏轶华,李旭刚. 统计与决策. 2017(12)
[10]基于模糊信息粒化支持向量机的短期电力负荷预测[J]. 孔平,陈亮,马晶. 电力信息与通信技术. 2016(01)
博士论文
[1]时间序列的多粒度智能分析方法研究[D]. 邓伟辉.中国科学院大学(中国科学院重庆绿色智能技术研究院) 2017
[2]时间序列分类算法研究[D]. 原继东.北京交通大学 2016
[3]基于模糊理论的时间序列预测研究[D]. 王威娜.大连理工大学 2016
[4]基于粒计算的时间序列分析与建模方法研究[D]. 卢伟.大连理工大学 2015
[5]时间序列数据挖掘中的特征表示与相似性度量方法研究[D]. 李海林.大连理工大学 2012
硕士论文
[1]基于粒计算的区间值时间序列建模方法研究[D]. 周维.大连理工大学 2019
[2]基于多元粒时间序列的建模与预测研究[D]. 邵广豪.大连理工大学 2017
[3]不确定性时间序列的降维与相似性匹配研究[D]. 肖瑞.东华大学 2014
本文编号:3240659
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3240659.html