生物信息学中的特征选择
发布时间:2018-01-10 06:28
本文关键词:生物信息学中的特征选择 出处:《太原理工大学学报》2017年03期 论文类型:期刊论文
更多相关文章: 计算生物学 智能计算 数据挖掘 进化计算 神经网络
【摘要】:回顾了特征选择的主要原理及其在生物信息学中的最新应用。我们将特征选择看作组合优化或搜索问题,将特征选择法分为穷举搜索法、启发式搜索法以及混合法,其中启发式搜索法可以被进一步分为是否结合数据特征重要程度的排序,这样比常规对特征选择方法以滤波、封装和嵌入式的分类更为合理。
[Abstract]:The main principles of feature selection and its recent applications in bioinformatics are reviewed. We regard feature selection as a combinatorial optimization or search problem and divide feature selection into exhaustive search methods. Heuristic search method and hybrid method, where heuristic search method can be further divided into whether to combine the importance of data features ranking, which is more important than the conventional feature selection method to filter. Encapsulation and embedded classification are more reasonable.
【作者单位】: 太原理工大学信息工程学院;
【分类号】:Q811.4;TP18
【正文快照】: 在当今大数据时代,数据量、尤其是特征维度高速增大。当数据存在无关项或冗余项时,会大大降低学习算法的精度和效率。有时由于数据规模的增加甚至可导致数据挖掘算法完全失效,这种情况在生物信息学中尤为突出[1-6]。LANGLEY et[7-8]指出,不相关特征使学习算法的预测精确度下降
【相似文献】
相关期刊论文 前3条
1 邵壮超;张绍武;潘泉;施建宇;姜涛;;基于一种动态特征选择融合算法的蛋白质结构类预测[J];世界科技研究与发展;2005年06期
2 刘峤;王娟;陈伟;秦志光;;用于全基因组关联分析的一种基因自动选择算法研究[J];航天医学与医学工程;2010年04期
3 ;[J];;年期
相关博士学位论文 前3条
1 王爱国;微阵列基因表达数据的特征分析方法研究[D];合肥工业大学;2015年
2 张明锦;基于特征选择的多变量数据分析方法及其在谱学研究中的应用[D];华东理工大学;2011年
3 高青斌;蛋白质亚细胞定位预测相关问题研究[D];国防科学技术大学;2006年
相关硕士学位论文 前5条
1 皮阳;基于声音的生物种群识别[D];电子科技大学;2015年
2 张弘杨;HIV-1蛋白酶剪切位点预测与膜蛋白分类[D];湖南农业大学;2016年
3 魏莎莎;基因表达数据的特征选择及其分类算法研究[D];中国计量学院;2015年
4 赵剑;基于互信息频度的特征选择及其在SNP关联分析中的应用[D];西安电子科技大学;2009年
5 李海燕;互信息特征选择的研究及在代谢组学中的应用[D];大连理工大学;2010年
,本文编号:1404241
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1404241.html