一种基于树排序的增强随机森林模型
本文选题:分类 + 回归 ; 参考:《兰州大学》2017年硕士论文
【摘要】:分类模型和回归模型在经济、生物、保险等多个领域都有着广泛的运用,因而有效地提升模型的预测能力具有重要的理论和实际意义.随机森林是目前最为流行的统计机器学习算法之一,由于其实际表现出色、易于操作而被人们所熟知.在本论文中,我们首先构建较多的树,并利用out-of-bag样本标记树的准确性,然后通过聚合更精确的树以提高随机森林的预测性能,进而提出了增强随机森林模型.我们也将新提出的模型运用到一系列实际数据中,并与经典的随机森林、SVM和GBM方法进行了比较,得出新模型有着良好的竞争力,且确实比经典的随机森林模型表现出色.同时我们还着重讨论了如何选择新模型中的两个调节参数,并分别给出了经验的选取建议.
[Abstract]:Classification model and regression model are widely used in many fields such as economy, biology, insurance and so on. Therefore, it is of great theoretical and practical significance to effectively improve the prediction ability of the model. Stochastic forest is one of the most popular statistical machine learning algorithms. In this paper, we first construct more trees, and use the accuracy of out-of-bag sample marker tree, then aggregate more accurate trees to improve the prediction performance of stochastic forest, and then propose an enhanced stochastic forest model. We also apply the new model to a series of practical data and compare it with the classical stochastic forest SVM and GBM methods. It is concluded that the new model has good competitiveness and is indeed better than the classical stochastic forest model. At the same time, we also discuss how to select two adjustment parameters in the new model, and give some suggestions for the selection of experience.
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:F224
【相似文献】
相关期刊论文 前5条
1 曹正凤;谢邦昌;纪宏;;一种随机森林的混合算法[J];统计与决策;2014年04期
2 孟杰;;随机森林模型在财务失败预警中的应用[J];统计与决策;2014年04期
3 李升;宋舜宏;;网络入侵检测中属性分组的随机森林算法[J];计算机安全;2009年11期
4 刘微;罗林开;王华珍;;基于随机森林的基金重仓股预测[J];福州大学学报(自然科学版);2008年S1期
5 钱争鸣;李海波;于艳萍;;个人住房按揭贷款违约风险研究[J];经济研究;2010年S1期
相关会议论文 前7条
1 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
2 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
3 张天龙;梁龙;王康;李华;;随机森林结合激光诱导击穿光谱技术用于的钢铁分类[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
4 相玉红;张卓勇;;组蛋白去乙酰化酶抑制剂的构效关系研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
5 张涛;李贞子;武晓岩;李康;;随机森林回归分析方法及在代谢组学中的应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
6 冯飞翔;冯辅周;江鹏程;刘菁;刘建敏;;随机森林和k-近邻法在某型坦克变速箱状态识别中的应用[A];第八届全国转子动力学学术讨论会论文集[C];2008年
7 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
相关博士学位论文 前8条
1 张乾;基于随机森林的视觉数据分类关键技术研究[D];华南理工大学;2016年
2 薛小明;基于时频分析与特征约简的水电机组故障诊断方法研究[D];华中科技大学;2016年
3 曹正凤;随机森林算法优化研究[D];首都经济贸易大学;2014年
4 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
5 姚登举;面向医学数据的随机森林特征选择及分类方法研究[D];哈尔滨工程大学;2016年
6 岳明;基于随机森林和规则集成法的酒类市场预测与发展战略[D];天津大学;2008年
7 季斌;内蒙古浩布高地区多金属矿综合信息找矿预测研究[D];合肥工业大学;2017年
8 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
相关硕士学位论文 前10条
1 嵇智;一种基于树排序的增强随机森林模型[D];兰州大学;2017年
2 钱维;药品不良反应监测中随机森林方法的建立与实现[D];第二军医大学;2012年
3 韩燕龙;基于随机森林的指数化投资组合构建研究[D];华南理工大学;2015年
4 贺捷;随机森林在文本分类中的应用[D];华南理工大学;2015年
5 张文婷;交通环境下基于改进霍夫森林的目标检测与跟踪[D];华南理工大学;2015年
6 李强;基于多视角特征融合与随机森林的蛋白质结晶预测[D];南京理工大学;2015年
7 朱玟谦;一种收敛性随机森林在人脸检测中的应用研究[D];武汉理工大学;2015年
8 肖宇;基于序列图像的手势检测与识别算法研究[D];电子科技大学;2014年
9 李慧;一种改进的随机森林并行分类方法在运营商大数据的应用[D];电子科技大学;2015年
10 赵亚红;面向多类标分类的随机森林算法研究[D];哈尔滨工业大学;2014年
,本文编号:1829564
本文链接:https://www.wllwen.com/jingjifazhanlunwen/1829564.html