非平衡基因数据的差异表达基因选择算法研究
发布时间:2022-11-03 19:03
针对准确率不适于评价不平衡数据特征子集性能的缺陷,提出了F2-measure(简称F2)准则.为避免mRMR(minimal Redundancy-Maximal Relevance)的互信息方法倾向于选择多值特征,提出了归一化互信息SU(Symmetrical Uncertainty).针对最大化AUC(Area Under an ROC Curve)框架下,特征选择算法的特征与类标相关性、特征间相关性的取值范围(量纲)不一致问题,提出了归一化的特征权重.为加快特征选择过程,提出了结合SU和AUC的特征预选择,缩小特征搜索空间.提出动态加权顺序前向搜索DWSFS(Dynamic Weighted Sequential Forward Search)和动态加权顺序前向浮动搜索DWSFFS(Dynamic Weighted Sequential Forward Floating Search),以期得到分类性能更好的特征子集.基于最大化AUC和mRMR框架,结合上述创新点,设计出16种特征选择算法.7个经典二类不平衡基因数据集、3个多类不平衡(或近似平衡)基因数据集的50次重复实验表明:...
【文章页数】:20 页
【参考文献】:
期刊论文
[1]最大化ROC曲线下面积的不平衡基因数据集差异表达基因选择算法[J]. 谢娟英,王明钊,胡秋锋. 陕西师范大学学报(自然科学版). 2017(01)
[2]肿瘤基因选择方法LLE Score[J]. 李建更,逄泽楠,苏磊,陈思远. 北京工业大学学报. 2015(08)
[3]一种基于区分能力的多类不平衡文本分类特征选择方法[J]. 张延祥,潘海侠. 中文信息学报. 2015(04)
[4]基于统计相关性与K-means的区分基因子集选择算法[J]. 谢娟英,高红超. 软件学报. 2014(09)
[5]基于特征子集区分度与支持向量机的特征选择算法[J]. 谢娟英,谢维信. 计算机学报. 2014(08)
[6]面向不平衡问题的集成特征选择[J]. 李霞,王连喜,蒋盛益. 山东大学学报(工学版). 2011(03)
[7]肿瘤基因表达谱分类特征基因选取问题及分析方法研究[J]. 李颖新,李建更,阮晓钢. 计算机学报. 2006(02)
[8]一种基于递归分类树的集成特征基因选择方法[J]. 李霞,张田文,郭政. 计算机学报. 2004(05)
本文编号:3700453
【文章页数】:20 页
【参考文献】:
期刊论文
[1]最大化ROC曲线下面积的不平衡基因数据集差异表达基因选择算法[J]. 谢娟英,王明钊,胡秋锋. 陕西师范大学学报(自然科学版). 2017(01)
[2]肿瘤基因选择方法LLE Score[J]. 李建更,逄泽楠,苏磊,陈思远. 北京工业大学学报. 2015(08)
[3]一种基于区分能力的多类不平衡文本分类特征选择方法[J]. 张延祥,潘海侠. 中文信息学报. 2015(04)
[4]基于统计相关性与K-means的区分基因子集选择算法[J]. 谢娟英,高红超. 软件学报. 2014(09)
[5]基于特征子集区分度与支持向量机的特征选择算法[J]. 谢娟英,谢维信. 计算机学报. 2014(08)
[6]面向不平衡问题的集成特征选择[J]. 李霞,王连喜,蒋盛益. 山东大学学报(工学版). 2011(03)
[7]肿瘤基因表达谱分类特征基因选取问题及分析方法研究[J]. 李颖新,李建更,阮晓钢. 计算机学报. 2006(02)
[8]一种基于递归分类树的集成特征基因选择方法[J]. 李霞,张田文,郭政. 计算机学报. 2004(05)
本文编号:3700453
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3700453.html