当前位置:主页 > 科技论文 > 自动化论文 >

一种块增量偏最小二乘模型的研究

发布时间:2020-03-29 11:02
【摘要】:随着互联网技术的高速发展,各个领域的数据迅猛增长,我们进入了大数据(Big Data)时代。然而,数据量的增长不只带来了丰富的信息资源,更高的数据维数往往也相伴而至。为了能够顺利的对高维数据进行处理分析,就需要预先对数据进行降维处理。传统的数据降维算法一般采用批量方式(Batch Model)进行训练,这种训练方式需要在训练之前将所有样本数据载入内存;随着数据规模的不断扩大,传统的数据降维算法会因为所需的内存过大而无法使用。因此,如何让传统的数据降维模型适应并处理海量的高维数据是大数据时代研究的焦点之一。对于样本数量过多的情况,增量学习(Incremental Learning)技术是有效的解决办法之一。作为一种增量数据降维模型,增量式偏最小二乘(Incremental Partial Least Squares,IPLS)将增量学习技术与偏最小二乘模型相互结合,较好的解决了大规模数据的降维问题。但是,IPLS模型以单个样本为单位进行模型的更新,导致模型的计算效率不高、训练时间较长。针对这一问题,本文基于现有研究的基础上提出了一种块增量偏最小二乘(Chunk Incremental Partial Least Squares,CIPLS)算法,主要的创新性工作为:基于数据分块更新的思想对IPLS算法进行扩展,提出了一种块增量偏最小二乘算法。CIPLS模型将新增的样本数据划分为若干个数据块(Chunk),再以数据块为单位进行模型的在线更新,从而降低模型的更新频率,缩短训练时间。本文在K8版本的p53蛋白数据集和路透文本分类语料库上进行了大量的CIPLS算法与已有算法的对比实验。实验结果表明,本文提出的方法明显提高了增量式偏最小二乘算法的计算效率,大幅度缩短了训练时间,验证了块增量偏最小二乘算法的有效性。
【图文】:

降维处理,数据,降维技术,降维


本章对本文的研究内容中涉及到的相关基础理论知识进行介绍,包括数据降维技术与增量学习技术的概况介绍。首先阐述了数据降维技术的原理并列举了相关的数据降维方法;然后对增量学习技术的概念进行了说明,最后对改进的增量式数据降维方法进行了综述性的介绍。2.1 数据降维技术概况数据的特征维数不宜过高,这已经是模式识别领域的一条经验性的“公理”[21]。一般来说,大部分的分类模型都需要估计一些未知的参数,而这些参数的数量通常和特征空间的维数相关。在实际情况下,如果训练样本的数量有限,过高的特征维数往往会降低参数估计的精度,从而导致分类模型的性能下降。因此,在许多应用中,一般的做法是:首先,在最大限度的保留原始数据的信息的前提下,将数据的特征维数降低到一个合适的范围;然后再把降维后的数据送入后续的处理系统。数据降维的一般处理过程如图 2.1 所示。

原理图,多因变量,原理图


LS 算法在提取主成分时,同时考虑自变量和因变量的相关信 方法提取得到的主成分既能表达自变量的信息,也能表达因 研究的焦点是通过抽取潜在成分(latent component, latent var变量和多因变量的数据进行建模分析。其核心假设是,认为少量潜在成分(不是直接观察或测量到的变量)驱动的系统到潜在成分后,就可以采用潜在成分来表示原始数据,从而果。基于得到的低维空间,我们就可以方便的进行后续的分可以按照因变量数量的不同分为两类:多因变量 PLS 算法和。下面就分别对这两类算法进行介绍。变量 PLS 算法n 个观测样本点,自变量 = [ 1 2… ]和因变量 = , 1造样本数据矩阵 ∈ × 和 ∈ × 。
【学位授予单位】:南昌大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP181

【相似文献】

相关期刊论文 前10条

1 尤肖虎,何振亚;递归实现固定阶的偏最小二乘问题——几种新的快速算法[J];电子学报;1988年02期

2 倪永年;偏最小二乘分光光度法用于多组份分析[J];岩矿测试;1989年04期

3 康健;唐力伟;左宪章;李浩;张西红;;基于灰色小波核偏最小二乘的传感器网络数据预测融合研究[J];振动与冲击;2011年04期

4 张胜伟;秦斌;;偏最小二乘方法的财务预警模型研究的应用[J];工业控制计算机;2012年06期

5 姜英英;李晋明;;偏最小二乘通径模型在某高校学院综合实力评估中的实证研究(下)[J];教育教学论坛;2015年27期

6 杜树新;沈进昌;袁之报;;三维荧光光谱的多维偏最小二乘建模方法[J];激光杂志;2012年01期

7 贺军亮;崔军丽;张淑媛;李仁杰;查勇;;基于偏最小二乘的土壤重金属铜含量高光谱估算[J];遥感技术与应用;2019年05期

8 姜英英;李晋明;;偏最小二乘通径模型在某高校学院综合实力评估中的实证研究(上)[J];教育教学论坛;2015年23期

9 陈安珍;蒋万枫;袁航;孙磊;吴爱英;李新荣;马双成;;基于超高效液相色谱偏最小二乘判别分析法建立鉴别大黄真伪及种属预测模型的方法[J];中国药学杂志;2016年03期

10 常鹏;高学金;王普;;基于多向核熵偏最小二乘的间歇过程监测及质量预测[J];北京工业大学学报;2014年06期

相关会议论文 前10条

1 李科;;用偏最小二乘(PLS)回归法研究数据相关性[A];全国第六届分子振动光谱学术报告会文集[C];1990年

2 徐扬;胡文明;王伟;徐辰武;;基于多元偏最小二乘的多性状联合关联分析方法研究[A];第六届全国动植物数量遗传学学术研讨会论文摘要集[C];2014年

3 王检兵;曹东升;梁逸曾;;3褼_(7.4)的计算机预测并与其他软件方法比较[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

4 李大鹏;王惠文;;偏最小二乘Iogistic回归在鄱阳湖洪涝灾害预测中的应用[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年

5 王俊;许多宽;肖勇;王勇;陈志华;陈维建;;基于化学指标的烟叶产区正交偏最小二乘判别分析[A];中国烟草学会学术年会优秀论文集[C];2017年

6 樊霞;俞舟;;产学研协同创新有助于大学创新能力成长吗?——基于偏最小二乘路径模型的实证检验[A];中国系统工程学会第十八届学术年会论文集——A03系统科学理论研究创新[C];2014年

7 景明;蔡文生;邵学广;;Multiblock偏最小二乘方法的新应用[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年

8 岑芳明;王明文;王鹏鸣;戴玉娟;;基于核偏最小二乘分类的垃圾邮件过滤[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

9 李泽华;赵春晖;王伟;;一种基于稀疏偏最小二乘-典型相关分析(SPLS-CCA)的产品质量智能追溯方法[A];2018中国自动化大会(CAC2018)论文集[C];2018年

10 李建更;李辉;阮晓钢;;一种有效的肿瘤特征基因筛选方法[A];2013年中国智能自动化学术会议论文集(第五分册)[C];2013年

相关博士学位论文 前10条

1 曾雪强;偏最小二乘降维方法的研究与应用[D];上海大学;2009年

2 池清华;PLS隐变量空间模型预测控制算法研究[D];浙江大学;2015年

3 杨海涛;基于遗传算法的复合核偏最小二乘模型在组学数据疾病预测和分类中的应用[D];山西医科大学;2016年

4 石怀涛;基于多元统计分析的轧钢过程故障诊断与质量预报研究[D];东北大学;2012年

5 张海玉;张广才岭及完达山森林生物量遥感估测及变化驱动力分析[D];东北林业大学;2011年

6 田明璐;西北地区冬小麦生长状况高光谱遥感监测研究[D];西北农林科技大学;2017年

7 金鑫;基于动态PLS框架的鲁棒建模及预测控制方法研究[D];浙江大学;2016年

8 毛李帆;电网规划中长期负荷预测技术的研究[D];湖南大学;2011年

9 华回春;干扰性负荷谐波责任定量评估的理论与方法[D];华北电力大学;2014年

10 李明泽;东北林区森林生物量遥感估算及分析[D];东北林业大学;2010年

相关硕士学位论文 前10条

1 叶震麟;一种块增量偏最小二乘模型的研究[D];南昌大学;2019年

2 曾青霞;偏最小二乘优化及其在中医药数据分析中的应用研究[D];江西中医药大学;2019年

3 刘爽;混合溶液光谱分析与融合建模研究[D];东北大学;2015年

4 王岩;基于回归系数误差逐渐调优的增量偏最小二乘算法研究[D];东北大学;2015年

5 赵丙娟;基于偏最小二乘降维的人脸年龄估计研究[D];南昌大学;2017年

6 郑明辰;基于非线性偏最小二乘方法的急性电离辐射损伤早期伤情分类研究[D];苏州大学;2013年

7 杜晓慧;基于不同罚函数约束偏最小二乘的应用研究[D];长沙理工大学;2015年

8 韩杰伦;使用偏最小二乘方法对信令负荷进行评估[D];浙江大学;2017年

9 步文斌;基于偏最小二乘的人脸识别算法研究[D];重庆大学;2013年

10 郝竹林;融合偏最小二乘的随机森林方法在中医药领域的应用研究[D];江西中医药大学;2015年



本文编号:2605878

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2605878.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户52c46***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com