当前位置:主页 > 科技论文 > 软件论文 >

基于象限近邻与DFT的时间序列缺失值填充研究

发布时间:2019-11-27 07:43
【摘要】:实际应用中数据经常出现的缺失值将直接影响到数据挖掘算法的准确性,因此如何处理缺失值已成为数据分析领域必须解决的重要问题。目前采用填充算法进行缺失值填充已经成为一个重要的研究方向。所谓缺失填充就是以完全数据集为依据,采用统计学或机器学习算法推断和计算缺失值的过程。最近邻填充算法(kNNI)由于容易实现、计算方便和填充效果好而被广泛应用于实际生产中。但是其近邻的选取具有偏好性和k的确定具有随机性。为了克服kNNI的不足,QENNI算法被提出。DDWQ算法是在QENNI算法的基础上将完全数据集对缺失值的整体影响和象限近邻的影响进行综合考虑而提出的新方法。DDWQ的核心思想是以缺失值为中心,采用壳体包围缺失值的方法,使得每个完全数据都能分布到唯一象限中,将各个象限最近邻的距离和该近邻所在象限的完全数据集密度进行混合加权。它不仅能有效地避免kNNI中近邻选取的偏好性,而且将完全数据整体对缺失值的影响进行综合考虑。在公开数据集上的测试表明算法DDWQ的填充效果要比QENNI好。时间序列类型的数据在现实中是普遍存在的。本文通过DFT变换对时间序列的相似性和周期性进行了研究,并采用DFT距离对时间序列进行基于密度的聚类(DBSCAN)分析。在此基础上提出了基于DDWQ的混合时间序列缺失值填充算法。该算法的核心是将与待填充序列同一类别的序列和其完整周期上的子序列作为DDWQ算法的输入来对时间序列的缺失值进行填充。在模拟数据集上的测试表明,该算法填充准确率有一定提高。
【学位授予单位】:北京林业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 左爱文;郭宏武;王保保;;气象时间序列规则发现及其应用[J];陕西气象;2006年06期

2 刘猛洪;汪爱丽;;基于模糊时间序列的短期电力负荷预测[J];电子世界;2013年07期

3 K.D.C.Stoodley,卢润德;非连续含有准周期分量时间序列的实时监测(英文)[J];控制理论与应用;1986年01期

4 吴红花;刘国华;;不确定时间序列的规约方法[J];计算机工程;2012年21期

5 W.Gersch;黄劲涛;;混合自回归动平均时间序列的自回归参数估计[J];水声译丛;1980年03期

6 王立柱;刘晓东;;Granger相关性与时间序列预测[J];控制与决策;2014年04期

7 周巧临;傅彦;;科学数据时间序列的预测方法[J];电子科技大学学报;2007年06期

8 王阅;高学东;;基于重标级差分析的时间序列分割方法[J];计算机工程与应用;2008年29期

9 修春波;;时间序列一步预测方法[J];计算机应用研究;2010年04期

10 冯凯文;孟凡荣;牛强;闫秋艳;;基于趋势点状态模型的时间序列预测算法[J];计算机应用研究;2011年12期

相关会议论文 前10条

1 周家斌;张海福;杨桂英;;多维多步时间序列预报方法及其应用[A];中国现场统计研究会第九届学术年会论文集[C];1999年

2 马培蓓;纪军;;基于时间序列的航空备件消耗预测[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年

3 卢世坤;李夕海;牛超;陈蛟;;时间序列的非线性非平稳特性研究综述[A];国家安全地球物理丛书(八)——遥感地球物理与国家安全[C];2012年

4 李强;;基于线性模型方法对时间序列中异常值的检测及证券实证分析[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年

5 戴丽金;何振峰;;基于云模型的时间序列相似性度量方法[A];第八届中国不确定系统年会论文集[C];2010年

6 谢美萍;赵希人;庄秀龙;;多维非线性时间序列的投影寻踪学习逼近[A];'99系统仿真技术及其应用学术交流会论文集[C];1999年

7 张大斌;李红燕;刘肖;张文生;;非线性时问序列的小波-模糊神经网络集成预测方法[A];第十五届中国管理科学学术年会论文集(下)[C];2013年

8 黄云贵;;基于时间序列的电网固定资产投资规模研究[A];2012年云南电力技术论坛论文集(文摘部分)[C];2012年

9 李松臣;张世英;;时间序列高阶矩持续和协同持续性研究[A];21世纪数量经济学(第8卷)[C];2007年

10 陈赫;罗声求;;历史横断面数据的时间序列化[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年

相关重要报纸文章 前6条

1 ;《时间序列与金融数据分析》[N];中国信息报;2004年

2 何德旭 王朝阳;时间序列计量经济学:协整与有条件的异方差自回归[N];中国社会科学院院报;2003年

3 刘俏;让数据坦白真相[N];21世纪经济报道;2003年

4 西南证券高级研究员 董先安邋德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年

5 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年

6 任勇邋郑重;中国对世界钢材价格的影响实证分析[N];现代物流报;2007年

相关博士学位论文 前10条

1 张墨谦;遥感时间序列数据的特征挖掘:在生态学中的应用[D];复旦大学;2014年

2 张德成;滑坡预测预报研究[D];昆明理工大学;2015年

3 苗圣法;时间序列的模式检测[D];兰州大学;2015年

4 翁同峰;时间序列与复杂网络之间等价性问题及表征应用研究[D];哈尔滨工业大学;2015年

5 杨婷婷;用Argo浮标结合卫星观测估算北太平洋经向热输运[D];中国科学院研究生院(海洋研究所);2015年

6 王晓晔;时间序列数据挖掘中相似性和趋势预测的研究[D];天津大学;2003年

7 李桂玲;时间序列的分割及不一致发现研究[D];华中科技大学;2012年

8 周勇;时间序列时序关联规则挖掘研究[D];西南财经大学;2008年

9 张勇;时间序列模式匹配技术研究[D];华中科技大学;2012年

10 董晓莉;时间序列数据挖掘相似性度量和周期模式挖掘研究[D];天津大学;2007年

相关硕士学位论文 前10条

1 陈健;基于多变量相空间重构的投资组合策略研究[D];华南理工大学;2015年

2 兰鑫;时间序列的复杂网络转换策略研究[D];西南大学;2015年

3 米晓将;区域尺度下月均气温的时空演化格局研究[D];昆明理工大学;2015年

4 张鸣敏;基于支持向量回归的PM_(2.5)浓度预测研究[D];南京信息工程大学;2015年

5 林健;基于改进小世界回声状态网的时间序列预测[D];渤海大学;2015年

6 曹智丽;日气温和干旱指数支持向量回归预测方法[D];南京信息工程大学;2015年

7 高雄飞;基于分形理论的土壤含水量时间序列特性分析[D];长安大学;2015年

8 姚茜;城市安全生产发展目标研究[D];中国地质大学(北京);2015年

9 谢翠颖;苏州社会消费品零售总额简析[D];苏州大学;2015年

10 包仁义;基于时间序列的搜索引擎评估模型算法研究[D];东北师范大学;2015年



本文编号:2566524

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2566524.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7682d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com