基于对称不确定性和SVM递归特征消除的信息基因选择方法
本文选题:基因选择 切入点:对称不确定性 出处:《模式识别与人工智能》2017年05期
【摘要】:基因表达谱中存在大量与肿瘤分类无关的基因,严重降低肿瘤诊断的准确率.基因表达谱还存在高维小样本、噪声大等问题,增加肿瘤诊断的难度.为了获取基因数量较少且分类能力较强的信息基因子集,文中提出基于对称不确定性(SU)和支持向量机递归特征消除(SVM-RFE)的信息基因选择方法.首先利用SU评估基因和类标签之间的相关性,根据SU定义近似马尔科夫毯,快速消除大量无关和冗余基因.然后利用SVM-RFE进一步剔除冗余基因,获取有效的信息基因子集.实验表明,文中方法可以在选取维数较少或相等的信息基因子集情况下获取较高的肿瘤分类性能.
[Abstract]:There are a large number of genes not related to tumor classification in gene expression profiles, which seriously reduce the accuracy of tumor diagnosis. There are many problems in gene expression profiles, such as high dimension and small samples, large noise, etc. In order to obtain a subset of information genes with fewer genes and stronger classification ability, In this paper, an information gene selection method based on symmetric uncertainty (SUU) and support vector machine recursive feature cancellation (SVM-RFE) is proposed. Firstly, the correlation between genes and class tags is evaluated by Su, and the Markov blanket is approximated according to the definition of Su. A large number of unrelated and redundant genes are eliminated quickly. Then the redundant genes are further eliminated by SVM-RFE, and an effective subset of information genes is obtained. The proposed method can obtain higher tumor classification performance under the condition of selecting a subset of information genes with less dimension or equal dimension.
【作者单位】: 皖南医学院计算机教研室;安徽师范大学数学计算机科学学院;
【基金】:国家自然科学基金项目(No.61672386) 教育部人文社会科学研究规划基金项目(No.16YJAZH071) 安徽省自然科学基金项目(No.1708085MF142) 安徽高校省级自然科学研究重点基金项目(No.KJ2016A275,KJ2014A266)资助~~
【分类号】:R73;TP18
【参考文献】
相关期刊论文 前6条
1 董红斌;滕旭阳;杨雪;;一种基于关联信息熵度量的特征选择方法[J];计算机研究与发展;2016年08期
2 林俊;许露;刘龙;;基于SVM-RFE-BPSO算法的特征选择方法[J];小型微型计算机系统;2015年08期
3 谢娟英;高红超;;基于统计相关性与K-means的区分基因子集选择算法[J];软件学报;2014年09期
4 谢娟英;谢维信;;基于特征子集区分度与支持向量机的特征选择算法[J];计算机学报;2014年08期
5 张靖;胡学钢;李培培;张玉红;;基于迭代Lasso的肿瘤分类信息基因选择方法研究[J];模式识别与人工智能;2014年01期
6 崔自峰;徐宝文;张卫丰;徐峻岭;;一种近似Markov Blanket最优特征选择算法[J];计算机学报;2007年12期
【共引文献】
相关期刊论文 前10条
1 李锋;万小强;;基于关联矩阵的短信自动分类[J];计算机科学;2017年S1期
2 孙广路;宋智超;刘金来;朱素霞;何勇军;;基于最大信息系数和近似马尔科夫毯的特征选择方法[J];自动化学报;2017年05期
3 叶明全;高凌云;伍长荣;万春圆;;基于对称不确定性和SVM递归特征消除的信息基因选择方法[J];模式识别与人工智能;2017年05期
4 王欢;李红辉;张骏温;;改进K-means聚类的云任务调度算法[J];计算机与现代化;2017年02期
5 张娇鹏;王锋;梁吉业;;特征选择:一种面向数据取值更新的批处理机制[J];小型微型计算机系统;2017年02期
6 安旭;张树东;;基于支持向量机的模糊特征分类算法研究[J];计算机工程;2017年01期
7 谢娟英;王明钊;胡秋锋;;最大化ROC曲线下面积的不平衡基因数据集差异表达基因选择算法[J];陕西师范大学学报(自然科学版);2017年01期
8 徐庆娟;杨彬彬;;基于R软件的Lasso回归在肿瘤信息基因选择中的应用[J];广西师范学院学报(自然科学版);2016年04期
9 吴佳;曾惟如;陈瀚霖;唐雪飞;;基于隐马尔可夫模型的软件状态评估预测方法[J];软件学报;2016年12期
10 肖文华;包卫东;朱晓敏;邵屹杨;陈超;Jianhong Wu;;面向多源大数据云端处理的成本最小化方法[J];软件学报;2017年03期
【二级参考文献】
相关期刊论文 前10条
1 杨昙;冯翔;虞慧群;;基于多群体公平模型的特征选择算法[J];计算机研究与发展;2015年08期
2 段洁;胡清华;张灵均;钱宇华;李德玉;;基于邻域粗糙集的多标记分类特征选择算法[J];计算机研究与发展;2015年01期
3 谢娟英;谢维信;;基于特征子集区分度与支持向量机的特征选择算法[J];计算机学报;2014年08期
4 王毅;赵建军;冯巍巍;付龙文;陈令新;;基于自适应混沌粒子群优化的防空目标分配[J];计算机工程;2012年20期
5 张靖;胡学钢;张玉红;施万锋;;K-split Lasso:有效的肿瘤特征基因选择方法[J];计算机科学与探索;2012年12期
6 吴红霞;吴悦;刘宗田;雷州;;基于Relief和SVM-RFE的组合式SNP特征选择[J];计算机应用研究;2012年06期
7 朱红萍;巩青歌;雷战波;;基于遗传算法的入侵检测特征选择[J];计算机应用研究;2012年04期
8 姚旭;王晓丹;张玉玺;权文;;特征选择方法综述[J];控制与决策;2012年02期
9 袁浩;;基于粒子群算法的WSN路径优化[J];计算机工程;2010年04期
10 王树林;王戟;陈火旺;李树涛;张波云;;肿瘤信息基因启发式宽度优先搜索算法研究[J];计算机学报;2008年04期
【相似文献】
相关期刊论文 前10条
1 李钧涛;贾英民;;用于癌症分类与基因选择的一种改进的弹性网络(英文)[J];自动化学报;2010年07期
2 黄海燕;;高矮胖瘦由你说[J];大众科技;1999年08期
3 张树波;赖剑煌;;基于融合信息的癌症相关基因选择方法[J];计算机科学;2010年12期
4 姬翔;王安文;;一种基于SVM和相关性的基因选择方法[J];计算机应用与软件;2007年06期
5 黄海燕;;胖瘦将由你掌握——人类未来饮食的重大变革[J];大科技;1999年05期
6 游伟;李树涛;谭明奎;;基于SVM-RFE-SFS的基因选择方法[J];中国生物医学工程学报;2010年01期
7 石修权;王增珍;;多因子降维法在评价代谢酶基因-基因-环境交互作用中的应用[J];环境与健康杂志;2010年12期
8 丁剑涛,黄涛,李兰英,范钰,沈岩,吴冠芸;FMR1基因在人胚胎组织中的选择剪接表达[J];中国医学科学院学报;1997年04期
9 孟超;;“疯狂基因”:进化的动力?[J];中国新闻周刊;2011年46期
10 李钧涛;贾英民;;PCD型自适应弹性网络在微阵列分类中的应用[J];智能系统学报;2010年03期
相关会议论文 前3条
1 任伟;闫桂英;;利用聚类算法来研究基因选择问题[A];中国运筹学会第八届学术交流会论文集[C];2006年
2 张春美;;守望生命,关注人的尊严——基因伦理的若干热点问题[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
3 李卉卉;袁谷;;血管内皮生长因子(VEGF)基因启动子区G-四链体识别的研究[A];第六届全国化学生物学学术会议论文摘要集[C];2009年
相关重要报纸文章 前2条
1 郑诗亮;薛人望谈基因与生命[N];东方早报;2011年
2 本报记者 章勇;基因选择和饲养管理可改善羊肉颜色[N];中国畜牧兽医报;2014年
相关博士学位论文 前1条
1 张红燕;肿瘤信息基因选择与分类方法研究[D];湖南农业大学;2015年
相关硕士学位论文 前7条
1 高红超;基于聚类的基因选择算法和DPC聚类算法研究[D];陕西师范大学;2015年
2 周萍;基于频度与联合效应的基因选择[D];西安电子科技大学;2009年
3 曹涛;基于聚类的混合基因选择方法研究[D];湖南大学;2011年
4 姬翔;基于SVM的多病类诊断基因选择方法研究[D];西安电子科技大学;2005年
5 吴希贤;基于优化算法的基因选择与癌症分类[D];湖南大学;2008年
6 刘申岭;基于SVM的基因选择[D];西安电子科技大学;2004年
7 陆燕;基于启发式聚类的混合特征基因选择方法研究[D];湖南大学;2010年
,本文编号:1692626
本文链接:https://www.wllwen.com/yixuelunwen/zlx/1692626.html