基因表达数据中加权SAM法的基因选择和分类预测研究
发布时间:2022-02-18 12:58
目的使用高斯核函数和欧式距离函数改进微阵列显著分析法(significance analysis of microarray,SAM)得到MSAM1法(modified significance analysis of microarray-1,MSAM1)和MSAM2法(modified significance analysis of microarray-2,MSAM2),与SAM法、Relief法、支持向量机递归特征消除法(support vector machine recursive feature elimination, SVM-RFE)进行对比,评价在基因表达数据中MSAM1法、MSAM2法的基因选择和分类预测能力。方法从Bioconductor中的golubEsets包获得leukemia数据集(Golub等人给出了该数据集所包含的50个差异基因),运用R软件实现5种算法,分别用正确率和ROC曲线下面积即AUC值评价基因选择能力和分类预测能力,用Kruskal-Wallis H检验比较5种方法的正确率和AUC值的组间差异,进一步的两两比较采用SNK-q检验。结果正确...
【文章来源】:实用预防医学. 2020,27(12)
【文章页数】:4 页
【文章目录】:
1 原理与方法
1.1 SAM
1.2 加权SAM法
1.2.1 高斯核函数(Gaussian kernel)加权SAM法(MSAM1)
1.2.2 欧式距离(Euclidean distance)加权SAM法(MSAM2)
1.3 支持向量机(support vector machine,SVM)
1.4 Relief法
1.5 统计学方法
2 结 果
2.1 数据的离群值情况
2.2 5种方法正确率和AUC值的比较
2.3 5种方法筛选出的差异基因的比较
3 讨 论
【参考文献】:
期刊论文
[1]高维组学数据的变量筛选方法及其应用[J]. 侯艳,谢宏宇,张晓凤,李康. 中国卫生统计. 2016(03)
[2]支持向量机理论与算法研究综述[J]. 丁世飞,齐丙娟,谭红艳. 电子科技大学学报. 2011(01)
[3]微阵列数据癌症分类问题中的基因选择[J]. 张丽娟,李舟军. 计算机研究与发展. 2009(05)
[4]关于统计学习理论与支持向量机[J]. 张学工. 自动化学报. 2000(01)
本文编号:3630882
【文章来源】:实用预防医学. 2020,27(12)
【文章页数】:4 页
【文章目录】:
1 原理与方法
1.1 SAM
1.2 加权SAM法
1.2.1 高斯核函数(Gaussian kernel)加权SAM法(MSAM1)
1.2.2 欧式距离(Euclidean distance)加权SAM法(MSAM2)
1.3 支持向量机(support vector machine,SVM)
1.4 Relief法
1.5 统计学方法
2 结 果
2.1 数据的离群值情况
2.2 5种方法正确率和AUC值的比较
2.3 5种方法筛选出的差异基因的比较
3 讨 论
【参考文献】:
期刊论文
[1]高维组学数据的变量筛选方法及其应用[J]. 侯艳,谢宏宇,张晓凤,李康. 中国卫生统计. 2016(03)
[2]支持向量机理论与算法研究综述[J]. 丁世飞,齐丙娟,谭红艳. 电子科技大学学报. 2011(01)
[3]微阵列数据癌症分类问题中的基因选择[J]. 张丽娟,李舟军. 计算机研究与发展. 2009(05)
[4]关于统计学习理论与支持向量机[J]. 张学工. 自动化学报. 2000(01)
本文编号:3630882
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3630882.html
最近更新
教材专著