当前位置:主页 > 科技论文 > 自动化论文 >

融合改进K近邻和随机森林的机器学习方法

发布时间:2018-01-20 14:45

  本文关键词: 机器学习 K近邻 随机森林 支持向量机 目标分类 出处:《计算机工程与设计》2017年08期  论文类型:期刊论文


【摘要】:对K近邻和随机森林学习方法进行改进,提出一种融合的机器学习方法。通过计算待分类特征与训练库中各个类中心之间的距离,进行最近邻分类,增强K近邻学习方法的鲁棒性,提高其运算效率;通过随机划分将改进KNN分类器的多元输出转化为二元输出,用其构建随机森林中各个决策结点的决策函数,降低各决策结点数据的错分率,提高随机森林学习方法的目标分类正确率。实验结果表明,该方法对手写数字目标的分类正确率高于经典的K近邻、Adaboost、支持向量机和随机森林学习方法。
[Abstract]:The K-nearest neighbor and random forest learning methods are improved, and a fusion machine learning method is proposed. The nearest neighbor classification is carried out by calculating the distance between the feature to be classified and the distance between each class center in the training database. Enhance the robustness of K-nearest neighbor learning method and improve its computational efficiency; The multivariate output of the improved KNN classifier is transformed into a binary output by random partitioning, and the decision function of each decision node in the random forest is constructed to reduce the error rate of the data of each decision node. The experimental results show that the classification accuracy of this method is higher than that of classical K-nearest neighbor Adaboost. Support vector machine and stochastic forest learning method.
【作者单位】: 成都师范学院计算机科学学院;中原工学院信息商务学院信息技术系;
【基金】:中国博士后科学基金面上基金项目(2014M560730) 四川省科技厅应用基础基金项目(2015JY0071) 成都师范学院高层次引进人才专项科研基金项目(YJRC2014-9);成都师范学院自然科学类培育基金项目(CS14ZD02)
【分类号】:TP181
【正文快照】: 0引言目前经典的机器学习[1-3]方法有多种,如:K近邻(K-nearest neighbor,KNN)学习方法是一种简单的机器学习方法,实质上是一种统计分类器,分类时首先计算待分类特征向量与数据库中每一个特征向量之间的距离,选择最邻近的k个类别,然后统计这k个最邻近类别中每类训练样本出现的

【相似文献】

相关期刊论文 前10条

1 王象刚;;基于K均值随机森林快速算法及入侵检测中的应用[J];科技通报;2013年08期

2 张华伟;王明文;甘丽新;;基于随机森林的文本分类模型研究[J];山东大学学报(理学版);2006年03期

3 邱一卉;林成德;;基于随机森林方法的异常样本检测方法[J];福建工程学院学报;2007年04期

4 马昕;王雪;杨洋;;基于随机森林算法的大学生异动情况的预测[J];江苏科技大学学报(自然科学版);2012年01期

5 杨帆;林琛;周绮凤;符长虹;罗林开;;基于随机森林的潜在k近邻算法及其在基因表达数据分类中的应用[J];系统工程理论与实践;2012年04期

6 聂斌;王卓;杜建强;朱明峰;林剑鸣;艾国平;熊玲珠;;基于粗糙集和随机森林算法辅助糖尿病并发症分类研究[J];江西师范大学学报(自然科学版);2014年03期

7 郭颖婕;刘晓燕;郭茂祖;邹权;;植物抗性基因识别中的随机森林分类方法[J];计算机科学与探索;2012年01期

8 邱一卉;林成德;;基于随机森林和单类支持向量机的电信行业客户流失预测[J];厦门大学学报(自然科学版);2013年05期

9 于化龙;高尚;赵靖;秦斌;;基于过采样技术和随机森林的不平衡微阵列数据分类方法研究[J];计算机科学;2012年05期

10 姚登举;杨静;詹晓娟;;基于随机森林的特征选择算法[J];吉林大学学报(工学版);2014年01期

相关博士学位论文 前2条

1 张乾;基于随机森林的视觉数据分类关键技术研究[D];华南理工大学;2016年

2 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年

相关硕士学位论文 前10条

1 朱琪;基于最大平衡度与最大共识的改进随机森林算法研究[D];吉林大学;2016年

2 马骊;随机森林算法的优化改进研究[D];暨南大学;2016年

3 程政;城市道路短时车流量预测模型研究[D];中国科学技术大学;2016年

4 陈实;基于随机森林的神经肽剪切位点预测方法研究[D];华中科技大学;2015年

5 胡宗杰;基于极值随机森林的慢性胃炎中医问诊证候分类研究[D];华东理工大学;2017年

6 康雅文;基于随机森林的医疗行业供应商的等级评估模型[D];安徽大学;2017年

7 李贞贵;随机森林改进的若干研究[D];厦门大学;2013年

8 姚明煌;随机森林及其在遥感图像分类中的应用[D];华侨大学;2014年

9 肖坚;基于随机森林的不平衡数据分类方法研究[D];哈尔滨工业大学;2013年

10 雍凯;随机森林的特征选择和模型优化算法研究[D];哈尔滨工业大学;2008年



本文编号:1448580

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1448580.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8927b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com