当前位置:主页 > 科技论文 > 基因论文 >

面向基因数据分类的核主成分分析旋转森林算法

发布时间:2018-03-08 21:11

  本文选题:核函数 切入点:主成分分析 出处:《计算机科学与探索》2017年10期  论文类型:期刊论文


【摘要】:旋转森林(rotation forest,Ro F)是一种运用线性分析理论和决策树的集成分类算法,在分类器个数较少的情况下仍可以取得良好的结果,同时能保证集成分类的准确性。但对于部分基因数据集,存在线性不可分的情况,原始的算法分类效果不佳。提出了一种运用核主成分分析变换的旋转森林算法(rotation forest algorithm based on kernel principal component analysis,KPCA-Ro F),选择高斯径向基核函数和主成分分析的方法对基因数据集进行非线性映射和差异性变化,着重于参数的选择问题,再利用决策树算法进行集成学习。实验证明,改进后的算法能很好地解决数据线性不可分的情形,同时也提高了基因数据集上的分类精度。
[Abstract]:Rotation forestRo F) is an integrated classification algorithm based on linear analysis theory and decision tree. It can obtain good results even if the number of classifiers is small. It can also ensure the accuracy of the integrated classification. However, for some gene data sets, there is linear inseparability. This paper presents a rotation forest algorithm based on kernel principal component analysis KPCA-Ro FN algorithm based on kernel principal component analysis (KPCA). Gao Si radial basis kernel function and principal component analysis (PCA) are used to analyze the genetic data set. Nonlinear mapping and variation of differences, The experiment shows that the improved algorithm can solve the problem of inseparability of data line and improve the classification accuracy of genetic data set.
【作者单位】: 中国计量大学信息工程学院;中国计量大学现代科技学院;
【基金】:国家自然科学基金Nos.61272315,60905034 浙江省自然科学基金No.Y1110342 国家安全总局项目No.zhejiang-00062014AQ~~
【分类号】:R73-3;TP18


本文编号:1585563

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/1585563.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0e601***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com