当前位置:主页 > 科技论文 > 基因论文 >

面向基因表达数据的并行特征选择及集成分类

发布时间:2021-01-13 23:46
  生物信息学的研究处在一个数据爆炸的时代,近年来在基因组学、代谢组学、转录组和蛋白质组学等领域技术的进步,使得生物学家可以有更多的数据从不同方面对生命体进行分析。非正常的生命活动通常会导致基因的异常表达,这种表达值的变化可以通过微阵列技术以基因表达数据的形式呈现出来。对基因表达数据的分析可以诊断和识别植物胁迫响应类型,在出现相应症状之前减少由这些胁迫造成的影响。因为基因选择是分类中非常重要的一步,高效的基因选择和样本分类方法在大规模基因表达数据的分析中变得越来越重要。Pathway是通路映射的集合,它代表了在分子间相互作用、反应和关系网络上的知识。利用Pathway知识进行基因初步选择,每个Pathway单元对应一个基因子集,提高基因选择结果在生物学角度上的可解释性。本文采用基于相交邻域粗糙集的属性约简方法在每个基因子集中筛选出关键基因。在集成分类阶段,采用结合近邻传播聚类的选择性集成方法。使用近邻传播聚类对基分类器进行聚簇划分,选择作为类代表点的基分类器参与最后的集成分类。在拟南芥胁迫响应相关的基因表达数据集上进行实验,表明结合Pathway知识的集成方法与现有的经典集成方法相比在准确... 

【文章来源】:大连理工大学辽宁省 211工程院校 985工程院校 教育部直属院校

【文章页数】:57 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
    1.3 研究内容及论文结构
2 特征选择与样本分类相关方法
    2.1 特征选择方法
    2.2 基于基因表达数据的集成分类方法
    2.3 海量生物数据的并行处理
    2.4 相交邻域粗糙集在基因表达数据中的应用
    2.5 本章小结
3 结合Pathway知识和近邻传播聚类的选择性集成分类
    3.1 融合Pathway知识的基因选择方法
        3.1.1 生物知识融合方法
        3.1.2 基于相交邻域粗糙集的基因选择
    3.2 结合近邻传播聚类的选择性集成分类方法
        3.2.1 近邻传播聚类
        3.2.2 相似性矩阵计算方法
        3.2.3 选择性集成分类流程
    3.3 实验结果与分析
        3.3.1 实验数据集及设置
        3.3.3 实验结果及分析
    3.4 本章小结
4 基于并行基因选择的动态选择性集成分类
    4.1 并行相交邻域粗糙集计算方法
        4.1.1 相交邻域粗糙集的矩阵表示方法
        4.1.2 并行相交邻域粗糙集算法
    4.2 多种启发信息在基因选择模型中的应用
        4.2.1 基因选择中的启发信息
        4.2.2 基于相交邻域粗糙集的基因选择
    4.3 基因表达数据的动态选择性集成分类方法
        4.3.1 基分类器之间的距离计算
        4.3.2 动态选择性集成
    4.4 实验结果与分析
        4.4.1 实验数据集及设置
        4.4.2 实验结果及分析
        4.4.3 对比实验
    4.5 本章小结
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢



本文编号:2975771

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/2975771.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b384a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com