K-S检验与mRMR相结合的基因选择算法
发布时间:2017-09-03 10:41
本文关键词:K-S检验与mRMR相结合的基因选择算法
更多相关文章: 基因选择 K-S检验 最小见余最大相关 支持向量机 F_measure AUC RELIEF FAST
【摘要】:为了解决基因数据集的基因选择难题,提出一种基于K-S检验与最小冗余最大相关(minimum redundancy-maximum relevance,mRMR)原则的基因选择算法。该算法先采用K-S检验选择出具有一定区分能力的基因,然后对选择到的基因进行mRMR判断,保留与类别高度相关而其间相关性较小的基因构成最终被选基因子集。以SVM为分类器,以F1_measure、分类准确率和AUC为评价指标对该算法选择的基因子集进行评估,并将本算法与K-S检验、mRMR,以及经典的RELIEF和FAST算法进行比较。五个经典基因数据集上的平均实验结果表明:本算法的运行时间远低于mRMR算法,且其各项评价指标值优于其他比较算法。因此,提出的K-S检验与mRMR结合的基因选择算法能选择到非常有效的基因子集。
【作者单位】: 陕西师范大学计算机科学学院;陕西师范大学生命科学学院;
【关键词】: 基因选择 K-S检验 最小见余最大相关 支持向量机 F_measure AUC RELIEF FAST
【基金】:陕西省科技攻关项目(2013K12-03-24) 国家自然科学基金资助项目(31372250) 中央高校基本科研业务费专项资金项目(GK201503067)
【分类号】:Q811.4;TP181
【正文快照】: 0引言基因微阵列技术加速了高维小样本基因数据集的产生。分析基因数据以挖掘其隐含的信息是当前生物信息学研究的重点[1,2]。基因数据分析包括基因数据获取、基因数据预处理、基因选择、分类模型建立与评估四个步骤[3]。其中,基因数据获取是生物医学过程,其他步骤则是数据挖,
本文编号:784568
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/784568.html
最近更新
教材专著