基于SVM的DNA微阵列数据分类研究
发布时间:2024-07-09 02:30
20世纪后期,信息技术的快速发展催生了一门新的学科即生物信息学,生物信息学依靠数学和人工智能与生物医学的有机结合,已经在肿瘤基因表达谱分析、基因变异和蛋白质结构分析等领域取得了丰硕成果,成为了研究的热点。利用信息处理技术对肿瘤基因表达谱数据进行分析,对于揭示病变产生的原因、发展机理、疾病诊断、药物研制都有很强的现实意义。基因表达谱数据具有自身的特性,主要表现在小样本、高维、高噪声及高冗余方面,这些特性使得传统的分类方法在处理基因表达谱数据时往往效果不好,支持向量机对具有小样本、高维的数据进行分类效果良好。为了克服基因表达谱数据高噪声及冗余对分类器性能的影响,需要对原始数据进行特征选择。本文总结了目前在基因表达谱数据分类中的常用方法,针对这些方法存在的问题,开展研究,研究主要从两个方面进行:(1)特征基因选择方法研究。首先使用ReliefF方法对特征基因进行初步筛选,实现降低搜索空间的维数,初步去除冗余及噪声;然后使用混合和声差分算法确定最优特征基因组合。混合方法能够克服传统和声搜索方法局部寻优能力差,解精度低的缺陷,同时能克服差分进化算法容易陷入局部最优的问题。仿真实验结果表明,利用这...
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
本文编号:4004251
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1-1过滤法基本原理和流程图
掘技术在基因表达谱数据中的研究内容主要有:特征基因选取异性分析等,本文主要研究特征基因选择算法和基因表达谱样在分析现有文献里各种算法的基础上设计相关的特征基因选取类算法,进一步提升样本分类的效率和准确度。特征基因选择的研究现状因选择方法主要可以分为过滤式、缠绕式、和嵌入式。过滤....
图1-2缠绕法基本原理与流程图
2)缠绕式绕式(Wrapper)是以某个特征子集合对分类性能的重要性程度为指标选择,先使用分类器对初始的特征子集的分类性能进行评价,然而依始的特征子集进行合理的调整,以得到性能更优的特征子集,上述过以得到性能最优的特征子集[23],这个特征子集的构造完成就可以实现。利用缠绕式进行....
图2-1特征基因选择的一般步骤流程图
研发疗效更好的新药物。.2特征基因的选择过程特征基因选择的一般过程如下:(1)第一步:选取合适的方法从原始数据集中选择一个特征子集;(2)第二步:根据具体研究对象选取度量指标并建立评价模型对选择的特征子行分析评价;(2)第三步:将评价结果与设定目标阀值(准则)进行比较,若评价结....
图3-1分类模型的一般过程
3基因表达谱数据分类基础理论3.1组织样本分类在数据挖据的研究领域中,样本的分类问题是指通过建立模型对现有的样本数据有监督学习,寻找样本属性间的联系。挖掘隐含的数据集关系或规则,最后用建立的模型或规则对未知类型的数据进行分类,目前,样本分类是模式识别、图形检测、故障排查、疾病....
本文编号:4004251
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/4004251.html