基因表达数据特征子集的冗余研究
发布时间:2024-03-16 11:30
过滤式特征选择是一种在基因表达数据上广泛使用且简单有效的方法。针对其特征子集冗余性问题,使用皮尔逊相关系数,提出一种带冗余去除的特征选择算法。研究了在不同相关强度下特征子集冗余去除及分类准确度效果。实验选用三个不同的基因表达数据集,使用支持向量机、k近邻、随机森林作为分类器分别进行了测试。实验结果表明,带冗余去除的过滤式特征选择方法在不同分类器上均能获得良好的分类性能,另外,此方法在降低特征子集维度的同时能够提高分类准确度。
【文章页数】:6 页
【文章目录】:
一、引 言
二、过滤式特征选择的统计方法
(一) t检验
(二) 秩和检验
三、特征子集的冗余去除模型
(一) 皮尔逊相关系数
(二) 冗余去除模型
四、带冗余去除的特征基因选择算法
(一) 特征选择算法
(二) 冗余去除算法
五、实验及结果
(一) 特征选择结果
(二) 冗余去除效果
(三) 分类准确度
六、结 语
本文编号:3929592
【文章页数】:6 页
【文章目录】:
一、引 言
二、过滤式特征选择的统计方法
(一) t检验
(二) 秩和检验
三、特征子集的冗余去除模型
(一) 皮尔逊相关系数
(二) 冗余去除模型
四、带冗余去除的特征基因选择算法
(一) 特征选择算法
(二) 冗余去除算法
五、实验及结果
(一) 特征选择结果
(二) 冗余去除效果
(三) 分类准确度
六、结 语
本文编号:3929592
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3929592.html