当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于多评价标准融合的医疗数据特征选择算法

发布时间:2021-07-20 06:00
  基于医疗数据具有高维度、稀疏等特点,本文提出了一种融合多个评价标准的递归特征消除算法.首先,应用过滤型特征评价标准对特征进行初步筛选;然后,采用特征序列方法对多个特征评价标准的结果进行融合;最后,结合递归特征消除搜索方法进行特征选择.在医疗数据集上与使用单一评价标准的特征选择方法进行疾病预测性能对比实验.结果表明:本文所提方法的预测表现优于其他特征选择方法,其预测的AUC值、精确率、召回率、F1值、准确率均有所提升. 

【文章来源】:复旦学报(自然科学版). 2019,58(02)北大核心CSCD

【文章页数】:7 页

【部分图文】:

基于多评价标准融合的医疗数据特征选择算法


图1基于特征序列的多评价标准融合方法Fig.1Featureranking-basedmulti-criterionfusion

分类器,算法


图3LR分类器中5种算法AUC值对比Fig.3AUCcomparisonsamong5algorithmsusingLRclassification图4SVM分类器中5种算法AUC值对比Fig.4AUCcomparisonsamong5algorithmsusingSVMclassification通过图3、图4可以发现,MCF-RFE方法在2个分类器中表现均优于其他4种方法,其中SVM-RFE方法表现优于AW-SVM方法.例如,在LR分类器中(图3),当选择50个特征时,MCF-RFE方法得到的AUC值为0.884,AW-DT方法的AUC值为0.852,SVM-RFE方法的AUC值为0.822,AW-SVM方法的AUC值为0.747,AW-LR方法的AUC值为0.708.随着特征数增加,本文选择集成的AW-SVM、AW-DT、AW-LR3种评价标准的预测结果具有互补性,并且逐渐趋向稳定.由于以上特征选择方法是在卡方检验筛选出的500个特征的基础上再次进行筛选,因此随着特征数增加,各特征选择方法筛出的特征子集包含越来越多的共同特征,使得各方法的AUC值差距逐渐减小.表15种特征选择方法的预测表现Tab.1Thepredictionperformanceof5featureselectionalgorithms分类器特征选择方法PRF1ALRAW-LR0.780.500.610.70LRAW-SVM0.740.730.730.75LRA

分类器,算法


图3LR分类器中5种算法AUC值对比Fig.3AUCcomparisonsamong5algorithmsusingLRclassification图4SVM分类器中5种算法AUC值对比Fig.4AUCcomparisonsamong5algorithmsusingSVMclassification通过图3、图4可以发现,MCF-RFE方法在2个分类器中表现均优于其他4种方法,其中SVM-RFE方法表现优于AW-SVM方法.例如,在LR分类器中(图3),当选择50个特征时,MCF-RFE方法得到的AUC值为0.884,AW-DT方法的AUC值为0.852,SVM-RFE方法的AUC值为0.822,AW-SVM方法的AUC值为0.747,AW-LR方法的AUC值为0.708.随着特征数增加,本文选择集成的AW-SVM、AW-DT、AW-LR3种评价标准的预测结果具有互补性,并且逐渐趋向稳定.由于以上特征选择方法是在卡方检验筛选出的500个特征的基础上再次进行筛选,因此随着特征数增加,各特征选择方法筛出的特征子集包含越来越多的共同特征,使得各方法的AUC值差距逐渐减小.表15种特征选择方法的预测表现Tab.1Thepredictionperformanceof5featureselectionalgorithms分类器特征选择方法PRF1ALRAW-LR0.780.500.610.70LRAW-SVM0.740.730.730.75LRA

【参考文献】:
期刊论文
[1]狼疮性肾炎发病机理的研究进展[J]. 聂英坤,张凤山,孙凤琴.  中国免疫学杂志. 2003(11)



本文编号:3292278

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3292278.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户de327***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com