压缩回归与分类算法研究
发布时间:2022-01-27 22:22
随着大规模高维数据在研究和工业领域的普及,对数据分析和知识发现的可扩展计算技术的需求越来越大。将这些数据转化为知识的关键是学习高效的数据统计模型。由于计算机的性能限制,在单机环境下利用大规模数据集学习模型具有很大的局限性;同时,现有的大量学习统计模型的方法,通常在应用于大规模数据时具有较高的计算成本,或者产生学习能力不强的模型。为了解决这两个问题,本文开展了压缩回归与分类问题的算法与应用研究,本文提出了一种基于定长编码的矩阵压缩方法,并支持快速时间内的随机访问;在此基础上建立了基于压缩矩阵的偏最小二乘回归和偏最小二乘逻辑回归算法,提高了偏最小二乘方法的扩展能力和学习能力。具体内容如下:首先,为了解决单个计算机应用大规模数据集的局限性,本文设计了一种基于定长编码的矩阵压缩算法BCSM(blocked compressed sparse Matrix),该算法按照矩阵行序进行压缩,将所有非零位置的索引连接并进行分块压缩,同时支持快速时间内随机访问矩阵,以应用于分类与回归模型中大量的矩阵运算。之后,本文将压缩矩阵应用于机器学习模型中,提出了基于压缩矩阵的偏最小二乘算法NFPLS。该方法将特征...
【文章来源】:西安电子科技大学陕西省211工程院校教育部直属院校
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
线性回归与线性分类图
西安电子科技大学硕士学位论文2.2 稀疏矩阵压缩算法机器学习模型中通常包含许多矩阵计算,许多模型中更需要用到高维稀疏矩阵。在计算机中存储和操作稀疏矩阵时候,通常需要使用特殊的算法和数据结构以充分发挥矩阵的稀疏性。如果将标准的密集矩阵存储的数据结构和算法用于稀疏矩阵是很慢的并且是低效的,因为大量的计算和存储浪费在零元素上面。因此对于稀疏矩阵的压缩存储是很有必要的。本节将介绍压缩稀疏行 CSR 格式。
西安电子科技大学硕士学位论文括标记或未标记图像数据[39]、表示语音的 M袋和电影的用户评级[41]。在条件形式下,它动捕获数据或语音[42]。受限玻尔兹曼机经常为玻尔兹曼机的一个变种,标准的玻尔兹曼个全连接图,其训练结构极其复杂,受限玻的连接,而删除了同层神经元之间的连接,样的操作将玻尔兹曼机的结构由完全图简化尔兹曼机算法获得更有效的训练。 网络结构
本文编号:3613188
【文章来源】:西安电子科技大学陕西省211工程院校教育部直属院校
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
线性回归与线性分类图
西安电子科技大学硕士学位论文2.2 稀疏矩阵压缩算法机器学习模型中通常包含许多矩阵计算,许多模型中更需要用到高维稀疏矩阵。在计算机中存储和操作稀疏矩阵时候,通常需要使用特殊的算法和数据结构以充分发挥矩阵的稀疏性。如果将标准的密集矩阵存储的数据结构和算法用于稀疏矩阵是很慢的并且是低效的,因为大量的计算和存储浪费在零元素上面。因此对于稀疏矩阵的压缩存储是很有必要的。本节将介绍压缩稀疏行 CSR 格式。
西安电子科技大学硕士学位论文括标记或未标记图像数据[39]、表示语音的 M袋和电影的用户评级[41]。在条件形式下,它动捕获数据或语音[42]。受限玻尔兹曼机经常为玻尔兹曼机的一个变种,标准的玻尔兹曼个全连接图,其训练结构极其复杂,受限玻的连接,而删除了同层神经元之间的连接,样的操作将玻尔兹曼机的结构由完全图简化尔兹曼机算法获得更有效的训练。 网络结构
本文编号:3613188
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3613188.html