Adaboost算法的改进及应用
发布时间:2018-04-08 14:02
本文选题:Adaboost算法 切入点:K-means++算法 出处:《兰州大学》2017年硕士论文
【摘要】:Adaboost算法主要用于处理分类问题和回归问题,Adaboost算法的核心是将迭代生成的基分类器通过加权组合的方式生成强分类器.与我们接触较多的其他类机器学习算法相比,Adaboost算法能有效的避免过拟合的问题.本文主要将Adaboost算法用于分类问题.在经典的Adaboost算法中,基分类器的权重是通过基分类器对训练子集分类的错误率计算得来的,并被赋予固定的的权重,即生成的最终分类是唯一的.当测试样本与训练样本存在一定的偏差时,训练出的强分类器有可能就不具有很好的泛化能力,导致最终的分类结果不能达到我们的预期效果.本文提出了基于不同的测试样本生成不同的强分类器的想法.主要思想是,先将训练集通过K-means++算法聚类分组,再通过欧氏距离计算测试样本与各组的相似度,并通过错误率计算出各个基分类器对各组的权重,最后结合相似度和权重,加权组合生成最终的强分类器.本文选取2组数据集进行实证分析,最终得出,改进后的Adaboost算法比经典的Adaboost算法分类效果更好.
[Abstract]:In this paper , we put forward the idea of generating different strong classifiers by means of weighted combination . The main idea is that , when the test sample and the training sample have certain deviation , the weighted combination is used to generate the final strong classifier .
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP181;TP311.13
【参考文献】
相关期刊论文 前3条
1 张亮;李智星;王进;;基于动态权重的AdaBoost算法研究[J];计算机应用研究;2017年11期
2 曹莹;苗启广;刘家辰;高琳;;AdaBoost算法研究进展与展望[J];自动化学报;2013年06期
3 李亚军;刘晓霞;陈平;;改进的AdaBoost算法与SVM的组合分类器[J];计算机工程与应用;2008年32期
,本文编号:1721929
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1721929.html