当前位置:主页 > 科技论文 > 海洋学论文 >

缺失数据下极限学习机改进算法及其应用

发布时间:2019-02-28 14:05
【摘要】:二十一世纪以来,人类加快了对海洋资源探索的步伐,在大洋深海的中存在的大量的海洋资源,因此各个国家都在积极争取各自的海洋利益。在探索海底矿产资源的过程中,通过各种手段获得的大量数据存在缺失的情况,而处理缺失数据的矿产资源评价算法研究较为滞后。本文旨在研究能够处理带缺失数据的机器学习算法,以实现对海底矿产资源数据的利用和矿产资源的评价。 极限学习机(ELM)是近年来机器学习算法中较为成功的一个,其具有速度快和泛化能力强的特点。稀疏贝叶斯ELM(SBELM)算法和TROP-ELM算法是标准ELM算法最新的两个变种,,SBELM算法能够解决多分类问题,TROP-ELM能够解决回归问题。与标准ELM算法相比,以上两种ELM算法的变种不仅保留了ELM算法的优点,还能够得到更加紧凑的网络结构。然而,以上两种算法无法处理带缺失数据的数据集。为了解决这个问题,本文提出了两种基于ELM的处理缺失数据的方法,分别是:处理缺失数据的加性模型方法(Additivemodels for missing data,AM-MD)和处理缺失数据的自调节神经元状态模型(Self-adjusting neuron state models for missing data,SNSM-MD)。在UCI公开数据集上的实验结果说明了改进的SBELM算法和TROP-ELM算法与其它处理缺失数据的方法比,具有更好的泛化能力和效果。不仅如此,即使数据集中属性值缺失率达到50%,本文提出的ELM改进算法仍然具有较好的效果。最后,本文将改进的TROP-ELM算法用于带缺失数据的大洋海底钻孔数据的回归分析。
[Abstract]:Since the 21 century, mankind has accelerated the pace of exploration of marine resources, in the deep ocean of the existence of a large number of marine resources, so each country is actively striving for their own marine interests. In the process of exploring seabed mineral resources, a large number of data obtained by various means are missing, while the research on the evaluation algorithm of mineral resources which deals with missing data is lagged behind. The purpose of this paper is to study the machine learning algorithm which can process the missing data in order to realize the utilization of seabed mineral resources and the evaluation of mineral resources. Extreme Learning Machine (ELM) is one of the most successful machine learning algorithms in recent years. It has the characteristics of fast speed and strong generalization ability. Sparse Bayesian ELM (SBELM) algorithm and TROP-ELM algorithm are two new variants of standard ELM algorithm. SBELM algorithm can solve multi-classification problem and TROP-ELM algorithm can solve regression problem. Compared with the standard ELM algorithm, the variants of the above two ELM algorithms not only retain the advantages of the ELM algorithm, but also obtain a more compact network structure. However, the above two algorithms cannot deal with data sets with missing data. In order to solve this problem, two methods of processing missing data based on ELM are proposed in this paper. They are: additive model method (Additivemodels for missing data,) to deal with missing data. AM-MD and the self-regulated neuron state model (Self-adjusting neuron state models for missing data,SNSM-MD) for processing missing data. The experimental results on UCI open datasets show that the improved SBELM algorithm and TROP-ELM algorithm have better generalization ability and effect than other methods for processing missing data. Moreover, even if the missing rate of attribute value in data set is up to 50%, the improved ELM algorithm presented in this paper still has a good effect. Finally, the improved TROP-ELM algorithm is applied to regression analysis of ocean bottom borehole data with missing data.
【学位授予单位】:清华大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:P744;TP181

【相似文献】

相关期刊论文 前10条

1 金勇进;调查中的数据缺失及处理(Ⅰ)——缺失数据及其影响[J];数理统计与管理;2001年01期

2 金勇进;缺失数据的加权调整(系列之Ⅳ)[J];数理统计与管理;2001年05期

3 赵慧秀;马文卿;;带有缺失数据的估计方程[J];曲阜师范大学学报(自然科学版);2009年03期

4 庞新生;;缺失数据处理方法的比较[J];统计与决策;2010年24期

5 杨金英;崔朝杰;;图模型方法用于二值变量相关性分析中缺失数据的估计[J];中国卫生统计;2012年05期

6 帅平;李晓松;周晓华;刘玉萍;;缺失数据统计处理方法的研究进展[J];中国卫生统计;2013年01期

7 金勇进;缺失数据的偏差校正(系列三)[J];数理统计与管理;2001年04期

8 毕华,李济洪;带有缺失数据的聚类分析方法[J];华北工学院学报;2003年05期

9 李开灿;;有缺失数据的META-MARKOV模型的局部计算[J];应用数学学报;2007年03期

10 周伟萍;张德然;杨兴琼;;具有部分缺失数据时两个几何总体的估计[J];长春大学学报;2008年02期

相关会议论文 前8条

1 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年

2 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

3 陈楠;刘红云;;基于增长模型的缺失数据处理方法之比较[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年

4 肖进;贺昌政;;面向缺失数据的客户价值区分集成模型研究[A];中国企业运筹学[2010(1)][C];2010年

5 曾莉;张淑梅;辛涛;;IRT模型中缺失数据处理方法比较[A];第十一届全国心理学学术会议论文摘要集[C];2007年

6 孙玲;刘浩;袁长亮;;北京市城市快速路微波检测缺失数据分析[A];2008第四届中国智能交通年会论文集[C];2008年

7 张香云;;基于EM算法缺失数据下混合模型的参数估计[A];第十三届中国管理科学学术年会论文集[C];2011年

8 李晓煦;侯杰泰;;结构方程中缺失数据的处理:FIML,EM与MI[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年

相关博士学位论文 前10条

1 马友;基于QoS缺失数据预测的个性化Web服务推荐方法研究[D];北京邮电大学;2015年

2 彭清艳;广义函数型回归模型及缺失数据模型[D];云南大学;2016年

3 骆汝九;多指标综合评价的非参数方法和缺失数据的聚类方法研究[D];扬州大学;2011年

4 祝丽萍;几种缺失数据和高维数据模型的统计分析[D];山东大学;2012年

5 贾博婷;缺失数据下一类整值时间序列的统计推断[D];吉林大学;2014年

6 刘旭;在完全和缺失数据下基于非光滑估计方程的统计推断与变量选择问题[D];云南大学;2010年

7 赵鹏飞;混沌数据恢复与非线性系统的模型参考控制[D];吉林大学;2010年

8 陆福忠;数据缺失下的分布函数估计问题[D];复旦大学;2007年

9 赵慧秀;可交换的两值数据的统计分析[D];东北师范大学;2009年

10 付志慧;多维项目反应模型的参数估计[D];吉林大学;2010年

相关硕士学位论文 前10条

1 杨利华;缺失数据的处理方法研究及应用[D];景德镇陶瓷学院;2011年

2 袁中萸;多元线性回归模型中缺失数据填补方法的效果比较[D];中南大学;2008年

3 褚培肖;缺失数据下的有限混合计数数据模型的统计推断研究[D];昆明理工大学;2015年

4 申宁宁;纵向研究缺失数据多重填补及混合效应模型分析[D];山西医科大学;2015年

5 李少琼;纵向研究二分类缺失数据处理及加权估计方程的应用[D];山西医科大学;2015年

6 高宇钊;比值缺失数据的多重估算与心脏康复二级预防干预效果评价及应用[D];山西医科大学;2015年

7 李顺静;基于EM算法的缺失数据的统计分析及应用[D];重庆工商大学;2015年

8 汪静波;Logistic回归模型中缺失数据的处理[D];南京大学;2015年

9 朱建斐;数据集缺失数据恢复算法研究[D];西安电子科技大学;2015年

10 母建熊;基于饱和模型的带有缺失的可交换两值数据分析[D];东南大学;2015年



本文编号:2431865

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/haiyang/2431865.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0b4a9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com