当前位置:主页 > 经济论文 > 技术经济论文 >

基于AdaBoost回归树的多目标预测算法的研究

发布时间:2018-10-19 08:04
【摘要】:在大数据时代,如何利用好数据潜在信息价值,成为商业巨头能否实现经济飞速发展的重要因素。准确的目标预测,对于国民经济的发展具有不可估量的意义。在商业、经济和其他领域中,预测分析日益依赖于数据挖掘建模、统计、分析得出。随着互联网金融进程的推进,目标预测问题已成为具有现实意义的课题。多目标回归预测作为数据挖掘"年轻"的新兴领域,它与多标签分类学习紧密相关。现阶段,分类学习发展更成熟、更广泛。多标签分类学习的最新研究成果激发了我们能否将其成功地应用于多目标回归领域的探索。事实上,多目标预测已经出现在很多领域,如预测车辆部件的风噪、股票预测和生态模型等。预测问题通常涉及到相同的输入变量同时预测多个目标变量。当目标变量为二进制时,预测任务被称为多标签分类;当目标变量为实值时,预测任务称为多目标预测。在本文,我们提出了两种新的多目标回归方法:多目标堆叠(Multi-Target Stacking)和集成回归链(Ensemble of Regressor Chains)。灵感来自两种流行的多标签分类方法。MTS和ERC在第一阶段的训练,都将采用基于回归树AdaBoost算法(ART)建立的单目标预测(Single-Target Regression)模型作为基准方法;在第二阶段的训练,MTS和ERC都通过额外加入第一阶段的目标预测值作为输入变量来扩展第二阶段的输入变量空间,以此建立多目标预测模型。两种方法利用目标变量之间的关系,不同的是,ERC除了考虑目标的依赖性关系还考虑了目标的顺序问题。此外,我们总结了 MTS和ERC两种方法的缺点,并且对算法进行修改,提出了相应的改进版本 MTS Corrected(MTSC)和 ERC Corrected(ERCC)。本文另一个重要的贡献是提供真实世界存在的12个不同领域的数据。实验中六种方法的对比是根据12个大量且多样化的数据集进行实验评估,实验结果表明,修改后的回归链ERCC算法在多目标预测问题中表现最好,其性能明显优于单目标预测ART和最先进的多目标随机森林(MORF),也好于本文中提出的其他方法MTS、MTSC、ERC。除此之外,结果也表明,修改版本MTSC和ERCC使MTS和ERC性能得到显著提高。
[Abstract]:In big data's time, how to make good use of the potential information value of data has become an important factor whether the business giant can realize the rapid economic development. Accurate target prediction is of inestimable significance to the development of national economy. In commercial, economic and other fields, predictive analysis is increasingly dependent on data mining modeling, statistics, and analysis. With the development of Internet finance, target prediction has become a practical topic. As a new field of data mining, multi-objective regression prediction is closely related to multi-label classification learning. At present, classified learning is more mature and more extensive. The latest research results of multi-label classification learning have inspired us to apply it successfully in the field of multi-objective regression. In fact, multi-objective prediction has been used in many fields, such as wind noise prediction of vehicle components, stock forecasting and ecological models. The prediction problem usually involves the same input variables and multiple target variables. When the target variable is binary, the prediction task is called multi-label classification, and when the target variable is real, the prediction task is called multi-objective prediction. In this paper, we propose two new multiobjective regression methods: multiobjective stacking (Multi-Target Stacking) and integrated regression chain (Ensemble of Regressor Chains). The inspiration comes from two popular multi-label classification methods. In the first stage of MTS and ERC training, the single objective prediction (Single-Target Regression) model based on the regression tree AdaBoost algorithm (ART) will be used as the benchmark method. In the second stage of training, both MTS and ERC extend the input variable space of the second stage by adding the target prediction value of the first stage as input variables, so as to establish a multi-objective prediction model. The two methods take advantage of the relationship between the target variables, except that ERC considers the order of the target in addition to the dependency of the target. In addition, we summarize the shortcomings of MTS and ERC, modify the algorithm and propose the corresponding improved versions of MTS Corrected (MTSC) and ERC Corrected (ERCC). Another important contribution of this paper is to provide data on 12 different realms of the real world. The experimental results show that the modified regression chain ERCC algorithm performs best in the multi-objective prediction problem. Its performance is obviously superior to that of single objective prediction ART and the most advanced multiobjective random forest (MORF), and also better than the other methods proposed in this paper, MTS,MTSC,ERC.. In addition, the results also show that the modified versions of MTSC and ERCC significantly improve the performance of MTS and ERC.
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP18

【相似文献】

相关期刊论文 前10条

1 马勇,丁晓青;Real-Time Multi-View Face Detection and Pose Estimation Based on Cost-Sensitive AdaBoost[J];Tsinghua Science and Technology;2005年02期

2 林志阳;康耀红;雷景生;;基于Adaboost的车标定位方法[J];计算机工程;2008年11期

3 张磊;;基于AdaBoost的侧面人脸、人耳检测[J];科学大众;2008年08期

4 付忠良;;关于AdaBoost有效性的分析[J];计算机研究与发展;2008年10期

5 张岗亭;杨全;;两种Adaboost方法在人脸检测中的比较研究[J];微计算机信息;2009年24期

6 严超;王元庆;李久雪;张兆扬;;AdaBoost分类问题的理论推导[J];东南大学学报(自然科学版);2011年04期

7 李印;;基于AdaBoost的行人检测研究与实现[J];数字技术与应用;2012年03期

8 苏加强;丁柳云;;基于R的监督式AdaBoost异常值检测应用[J];淮海工学院学报(自然科学版);2013年01期

9 张志勋;张磊;杨凡;;一种改进的Adaboost人脸检测方法[J];自动化与仪器仪表;2013年06期

10 王海川,张立明;一种新的Adaboost快速训练算法[J];复旦学报(自然科学版);2004年01期

相关会议论文 前10条

1 Wen Feng;;A Novel Lips Detection Method Combined Adaboost Algorithm and Camshift Algorithm[A];2012年计算机应用与系统建模国际会议论文集[C];2012年

2 张超;苗振江;;基于AdaBoost的面部信息感知[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年

3 郭翌;汪源源;;基于Adaboost算法的颈动脉粥样硬化判别方法[A];中国仪器仪表学会第十一届青年学术会议论文集[C];2009年

4 张红梅;高海华;王行愚;;抑制样本噪声的AdaBoost算法及其在入侵检测中的应用[A];2007年中国智能自动化会议论文集[C];2007年

5 陆文聪;钮冰;金雨欢;;基于AdaBoost算法的亚细胞位置预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

6 陈宏伟;刘建伟;费向东;;一种半监督环境下的Adaboost算法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

7 唐晓丹;苗振江;;基于AdaBoost和粒子滤波的目标跟踪[A];第十四届全国图象图形学学术会议论文集[C];2008年

8 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年

9 ;Using Skin Color and HAD-AdaBoost Algorithm for Face Detection in Color Images[A];Information Technology and Computer Science—Proceedings of 2012 National Conference on Information Technology and Computer Science[C];2012年

10 肖磊;李丽;肖佳文;;基于AdaBoost-SVM的上市公司信用风险评估[A];2012管理创新、智能科技与经济发展研讨会论文集[C];2012年

相关博士学位论文 前5条

1 佟旭;基于复杂网络理论的糖尿病肾病辨证建模研究[D];北京中医药大学;2016年

2 刘冲;模拟电路故障诊断AdaBoost集成学习方法研究[D];大连海事大学;2011年

3 张太宁;人眼注视点估计方法的研究[D];南开大学;2013年

4 赵培英;基于智能计算的膜蛋白结构与相互作用预测研究[D];东华大学;2010年

5 闵欢;稀疏采样输出变量数据补缺的软仪表校正策略与方法[D];中国石油大学(北京);2016年

相关硕士学位论文 前10条

1 皮丽琴;基于AdaBoost-GASVM算法和LDA主题模型的短文本分类研究[D];华南理工大学;2015年

2 孙斌;一种基于Adaboost的实时行人检测算法[D];华南理工大学;2015年

3 蔡泽彬;基于视频分析的行人检测及统计方法研究[D];华南理工大学;2015年

4 游晴;Adaboost人脸检测算法研究及其在硬件平台上的实现[D];昆明理工大学;2015年

5 宋雨;基于视觉图片的脑—机接口控制研究[D];天津理工大学;2015年

6 林欣;基于改进肤色模型的AdaBoost人脸检测算法研究[D];陕西科技大学;2015年

7 袁浩杰;Adaboost算法的并行化及其在目标分类中的应用[D];华南理工大学;2015年

8 张恒;基于近红外图像的疲劳驾驶检测研究与系统实现[D];长安大学;2015年

9 朱非易;基于不平衡学习的蛋白质—维生素绑定位点预测研究[D];南京理工大学;2015年

10 张元;一种基于AdaBoost的组合分类算法研究[D];四川师范大学;2015年



本文编号:2280596

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jiliangjingjilunwen/2280596.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fef5d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com