当前位置:主页 > 科技论文 > 自动化论文 >

大数据的序贯预测和聚类研究

发布时间:2017-03-29 01:05

  本文关键词:大数据的序贯预测和聚类研究,,由笔耕文化传播整理发布。


【摘要】:信息技术的进步导致各行各业产生的数据越来越大,这使得大数据的研究迫在眉睫。本文分别研究了序贯数据的预测方法和高维无标签数据的聚类问题。(1)针对序贯得到样本量庞大的数据,我们提出了序贯线性回归方法。此方法不仅可以节约存储空间和提高计算速度,而且预测正确率比传统的均值预测高。根据数据获取的时间效应以及数据预测效果,我们又提出了加权重的序贯线性回归方法。(2)针对高维无标签数据,稀疏自表示神经网络方法进行降维,用数值优化方法求解神经网络并在隐层用k-means方法聚类。与其它聚类方法相比,我们从模拟数据和真实数据验证了稀疏自表示神经网络方法聚类的优越性。
【关键词】:大数据 序贯线性回归方法 加权的序贯线性回归方法 稀疏自表示神经网络的方法 聚类
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O212.1;TP183
【目录】:
  • 摘要5-6
  • ABSTRACT6-12
  • 主要符号对照表12-13
  • 第一章 绪论13-15
  • 1.1 大数据研究13
  • 1.2 序贯分析和高维数据聚类13-14
  • 1.3 文章结构14-15
  • 第二章 大数据预备知识15-33
  • 2.1 常见的聚类方法15-19
  • 2.1.1 k-means聚类16
  • 2.1.2 DBSCAN聚类16-17
  • 2.1.3 AGNES聚类17
  • 2.1.4 谱聚类17-19
  • 2.2 高维数据无监督降维方法19-24
  • 2.2.1 主成分分析方法19
  • 2.2.2 RUFS方法19-21
  • 2.2.3 SOCFS方法21-24
  • 2.3 数据挖掘算法24-25
  • 2.3.1 人工神经网络24-25
  • 2.4 数值优化算法25-33
  • 2.4.1 ADMM算法25-28
  • 2.4.2 线搜索方法28-33
  • 第三章 序贯大数据的预测方法33-45
  • 3.1 问题描述与基本模型33-35
  • 3.1.1 问题描述33
  • 3.1.2 线性模型33-35
  • 3.2 序贯线性回归(SLR)方法35-39
  • 3.2.1 序贯回归35-36
  • 3.2.2 带权重的序贯回归36-37
  • 3.2.3 序贯估计算法37-38
  • 3.2.4 序贯更新算法的收敛性38-39
  • 3.2.5 SLR方法的复杂度分析39
  • 3.3 真实数据实验39-45
  • 3.3.1 数据描述39-40
  • 3.3.2 实验结果40-45
  • 第四章 稀疏自表示神经网络聚类方法45-59
  • 4.1 一般的神经网络求解45-46
  • 4.2 自表示神经网络46
  • 4.3 稀疏自表示神经网络聚类46-59
  • 4.3.1 单隐层的稀疏自表示神经网络聚类(SAENN)47-51
  • 4.3.2 模拟数据实验51-54
  • 4.3.3 真实数据实验54-59
  • 第五章 总结59-61
  • 参考文献61-63
  • 致谢63-65
  • 在读期间发表的学术论文与取得的研究成果65

【相似文献】

中国期刊全文数据库 前10条

1 张志 ,王汉文;论加权拟线性回归方法[J];中南财经大学学报;1992年03期

2 刘妙龙;多变量对多变量线性回归方法及其在区域研究中的应用[J];湖北大学学报(自然科学版);1989年04期

3 杨小怡,黄世芹,姚雷;用线性回归方法建立贵阳市空气质量预报模式[J];贵州气象;2001年04期

4 钱海荣;线性回归方法的探讨[J];统计与决策;2005年11期

5 赵永翔,孙亚芳,高庆;分析常用7种统计分布的统一线性回归方法[J];机械强度;2001年01期

6 钱海荣;线性回归方法的改进[J];统计与决策;2004年08期

7 刘巍,王培麟;加权拟线性回归方法[J];宁夏工学院学报;1994年Z2期

8 陈少泳;基于线性回归方法的工程材料需求量预测[J];铁道物资科学管理;2004年03期

9 佟晓君;陈海彬;马群;张建;;双向线性回归方法[J];机械强度;2006年06期

10 段科锋,谢英亮;一种模糊线性回归方法及其应用[J];南方冶金学院学报;1998年01期

中国重要会议论文全文数据库 前1条

1 马铁丰;;线性回归方法进行时间序列异常值检验及证券投资风险研究[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年

中国硕士学位论文全文数据库 前3条

1 赵爽;血管紧张素转换酶基因多态性与高血压合并糖尿病的关系[D];华北理工大学;2015年

2 张青婷;大数据的序贯预测和聚类研究[D];中国科学技术大学;2016年

3 张秀伟;异方差双向线性回归方法及其在砼强度检测中的应用[D];河北理工大学;2009年


  本文关键词:大数据的序贯预测和聚类研究,由笔耕文化传播整理发布。



本文编号:273369

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/273369.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3449a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com