当前位置:主页 > 科技论文 > 基因论文 >

基因表达数据中加权SAM法的基因选择和分类预测研究

发布时间:2022-02-18 12:58
  目的使用高斯核函数和欧式距离函数改进微阵列显著分析法(significance analysis of microarray,SAM)得到MSAM1法(modified significance analysis of microarray-1,MSAM1)和MSAM2法(modified significance analysis of microarray-2,MSAM2),与SAM法、Relief法、支持向量机递归特征消除法(support vector machine recursive feature elimination, SVM-RFE)进行对比,评价在基因表达数据中MSAM1法、MSAM2法的基因选择和分类预测能力。方法从Bioconductor中的golubEsets包获得leukemia数据集(Golub等人给出了该数据集所包含的50个差异基因),运用R软件实现5种算法,分别用正确率和ROC曲线下面积即AUC值评价基因选择能力和分类预测能力,用Kruskal-Wallis H检验比较5种方法的正确率和AUC值的组间差异,进一步的两两比较采用SNK-q检验。结果正确... 

【文章来源】:实用预防医学. 2020,27(12)

【文章页数】:4 页

【文章目录】:
1 原理与方法
    1.1 SAM
    1.2 加权SAM法
        1.2.1 高斯核函数(Gaussian kernel)加权SAM法(MSAM1)
        1.2.2 欧式距离(Euclidean distance)加权SAM法(MSAM2)
    1.3 支持向量机(support vector machine,SVM)
    1.4 Relief法
    1.5 统计学方法
2 结 果
    2.1 数据的离群值情况
    2.2 5种方法正确率和AUC值的比较
    2.3 5种方法筛选出的差异基因的比较
3 讨 论


【参考文献】:
期刊论文
[1]高维组学数据的变量筛选方法及其应用[J]. 侯艳,谢宏宇,张晓凤,李康.  中国卫生统计. 2016(03)
[2]支持向量机理论与算法研究综述[J]. 丁世飞,齐丙娟,谭红艳.  电子科技大学学报. 2011(01)
[3]微阵列数据癌症分类问题中的基因选择[J]. 张丽娟,李舟军.  计算机研究与发展. 2009(05)
[4]关于统计学习理论与支持向量机[J]. 张学工.  自动化学报. 2000(01)



本文编号:3630882

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3630882.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户316fc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com