当前位置:主页 > 科技论文 > 自动化论文 >

基于划分与抽样的回归加速算法研究

发布时间:2021-01-01 22:23
  随着互联网技术的高速发展,来源于各行各业的数据正在以前所未有的速度增长,促使我们进入一个海量数据时代。面对海量数据,传统的数据挖掘技术在执行效率上受到了严峻的挑战,因此探索快速有效的加速学习算法是极其重要的。目前,现有的加速学习算法研究主要是关注大规模数据分类问题,回归与分类同等重要,但对于回归问题的研究相对较少。为此,本文以划分与抽样为研究策略,针对传统回归分析算法执行效率低的问题进行了系统性研究。主要工作概括如下:(1)利用分而治之思想提出了一种基于数据划分的核岭回归加速算法。首先利用一簇平行超平面将当前数据所在的空间划分为若干个互不相交的区域,然后在划分后的每个区域上训练核岭回归模型,最后每个核岭回归模型预测落入同一区域内的待识别实例。实验结果表明,提出算法的执行效率大幅度提升,为研究面向大规模数据的回归加速算法提供了一个可行性方案。(2)针对回归算法中核矩阵运算速度慢的问题,本文提出了一种基于两阶段抽样的核矩阵近似算法。首先使用聚类算法将数据分块,并采用抽样的策略分别计算每块数据核矩阵的低秩近似矩阵;然后基于标记信息构造块与块之间相互贡献的度量,进行二次抽样,抽取部分非对角块核... 

【文章来源】:山西大学山西省

【文章页数】:54 页

【学位级别】:硕士

【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 基于数据划分的回归加速算法
        1.2.2 基于抽样技术的回归加速算法
        1.2.3 基于混合策略的回归加速算法
    1.3 论文研究内容及组织结构
第二章 回归分析及相关知识
    2.1 回归分析
    2.2 矩阵秩近似
    2.3 核矩阵近似
    2.4 本章小结
第三章 基于数据划分的核岭回归加速算法
    3.1 引言
    3.2 基于数据划分的核岭回归加速算法
        3.2.1 数据划分算法
        3.2.2 时间复杂度分析
    3.3 实验分析
        3.3.1 实验设置
        3.3.2 实验结果
    3.4 本章小结
第四章 基于两阶段抽样的核矩阵近似算法
    4.1 引言
    4.2 基于两阶段抽样的核矩阵近似算法
        4.2.1 对角矩阵抽样近似算法
        4.2.2 非对角矩阵抽样近似算法
    4.3 实验分析
        4.3.1 实验设置
        4.3.2 实验结果
    4.4 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式


【参考文献】:
期刊论文
[1]低秩矩阵近似与优化问题研究进展[J]. 张恒敏,杨健,郑玮.  模式识别与人工智能. 2018(01)
[2]大数据下的机器学习算法综述[J]. 何清,李宁,罗文娟,史忠植.  模式识别与人工智能. 2014(04)
[3]数据集浓缩研究综述[J]. 顾静秋,吴华瑞,朱华吉.  计算机应用与软件. 2012(10)



本文编号:2952093

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2952093.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户89d55***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com