当前位置:主页 > 医学论文 > 肿瘤论文 >

基于信噪比与随机森林的肿瘤特征基因选择

发布时间:2018-07-15 12:05
【摘要】:在肿瘤特征基因选择过程中,传统分类方法会选出大量冗余基因,而大量冗余基因会造成分类精度低和时间复杂度较高等问题,为了解决上述问题,提出一种结合信噪比过滤法与随机森林算法的肿瘤特征基因选择方法.该方法包含两个过程:首先使用信噪比过滤法剔除原始特征空间中的无关和冗余基因,从而获得与分类属性相关性较高的基因,选择出分类能力较强的预选特征子集;其次使用随机森林算法对特征基因子集进行分类,最终获得分类结果.实验结果显示,该算法可以快速有效地选择出肿瘤特征基因,并具有较高的分类精度.
[Abstract]:In the selection process of tumor characteristic genes, the traditional classification method will select a large number of redundant genes, and a large number of redundant genes will lead to low classification accuracy and high time complexity. In order to solve the above problems, In this paper, a method of tumor feature gene selection combined with SNR filter and stochastic forest algorithm is proposed. The method consists of two processes: firstly, the independent and redundant genes in the original feature space are eliminated by SNR filtering method, and the genes with high correlation with the classification attributes are obtained, and the pre-selected feature subsets with strong classification ability are selected. Secondly, a random forest algorithm is used to classify the subsets of feature genes, and finally the classification results are obtained. Experimental results show that the proposed algorithm can select tumor characteristic genes quickly and effectively, and has high classification accuracy.
【作者单位】: 河南师范大学计算机与信息工程学院河南省高校计算智能与数据挖掘工程技术研究中心;
【基金】:国家自然科学基金(61370169,61402153) 河南省科技攻关重点项目(142102210056,162102210261)
【分类号】:R730.4;TP181

【参考文献】

相关期刊论文 前3条

1 关健;韩飞;杨善秀;;基于粒子群优化和判别熵信息的基因选择算法[J];计算机工程;2013年11期

2 姚登举;杨静;詹晓娟;;基于随机森林的特征选择算法[J];吉林大学学报(工学版);2014年01期

3 杨帆;林琛;周绮凤;符长虹;罗林开;;基于随机森林的潜在k近邻算法及其在基因表达数据分类中的应用[J];系统工程理论与实践;2012年04期

【共引文献】

相关期刊论文 前10条

1 余自林;张晓龙;;基于有效特征选择的高价值移动通信用户预测方法[J];武汉科技大学学报;2017年02期

2 张万福;;基于随机森林的图像语义分割算法的研究[J];电子科技;2017年02期

3 李磊;牟少敏;林中琦;;随机森林在棉蚜虫害等级预测中的应用[J];安徽农学通报;2017年01期

4 邓曦辉;赵丽;;基于数据块混合度量的加速K-近邻分类方法[J];计算机与现代化;2016年12期

5 韦泽鲲;夏靖波;张晓燕;付凯;申健;;基于随机森林的流量多特征提取与分类研究[J];传感器与微系统;2016年12期

6 张燕;;基于本质特征和网络特征的信用卡欺诈检测[J];微型电脑应用;2016年12期

7 陶志奇;;数据挖掘分类算法在产品分类中的应用与研究[J];现代商业;2016年34期

8 王江;孙美凤;张炜;何萍;;基于行为知识空间的多分类器网络流量分类方法[J];扬州大学学报(自然科学版);2016年04期

9 罗新;;基于随机森林的文本分类模型研究[J];农业图书情报学刊;2016年11期

10 徐天贺;马媛媛;徐久成;;一种基于邻域互信息最大化和粒子群优化的特征基因选择方法[J];小型微型计算机系统;2016年08期

【二级参考文献】

相关期刊论文 前4条

1 刘元宁;王刚;朱晓冬;赵正东;陈慧灵;邢,

本文编号:2124017


资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/zlx/2124017.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户6efd3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com