基于组学数据的癌症预后相关分子分型问题研究

发布时间:2024-07-08 22:53
  科学技术的迅猛发展推动了生物医学研究领域的极大进步,生物医学数据的爆发带来了一场数据革命,多年来积累了大量不同类型的癌症数据。癌症在分子层面上的定义一直是生物信息领域的重要研究内容,是辅助医疗诊断,快速为不同亚型的患者提供诊断方案的重要途径。探究在多样的生物数据中挖掘有效的潜在信息成为癌症分子分型的研究热点之一。当前,癌症的分子分型常用方式依然是对单个类型数据源的分子分型,并且大多是以无监督或者是半监督的方式学习,这些方法无法将多种与癌症发生与发展机制相关的数据类型高效利用,容易造成信息损失。整合多组学数据不仅能够挖掘癌症与相关组学分子数据的联系,还能够发现各组学数据之间对癌症的协同共享的作用关系。由于生物数据普遍具有特征维度广、噪声干扰多、样本量少等特点,本文基于相似性网络融合的方法对多组学癌症数据进行整合,并针对原有方法使用欧氏距离的局限性,提出一种基于深度子空间模型的相似性网络融合算法。对于融合后的相似性网络,使用谱聚类从而实现癌症预后相关分子分型任务。传统方法分子分型算法大多使用连续的组学数据,而忽略了许多离散组学数据的对于癌症分型问题的意义。本文利用网络传播算法,结合基因相互...

【文章页数】:58 页

【学位级别】:硕士

【部分图文】:

图1-1TCGA数据库癌症类型[5]

图1-1TCGA数据库癌症类型[5]

哈尔滨工业大学工学硕士学位论文-2-CancerGenomeAtlas,TCGA),该项目基于高通量测序技术,在数据库中收集了33种常见癌症的2万多名患者样本数据,如图1-1所示。TCGA除了包括临床数据外,还包括大量不同类型的组学数据(如DNA甲基化、micoRNA、转录组表达....


图2-1使用多种组学数据类型的分子分型[26]

图2-1使用多种组学数据类型的分子分型[26]

哈尔滨工业大学工学硕士学位论文-11-2.3整合多组学数据的癌症分型方法在近年的分子分型研究领域中,部分学者将当前已提出的方法根据数据融合的阶段大致分为三个大类[26]:前期整合、中期整合、后期整合。数据的前期整合是最容易的办法,通常是把多种类型数据对应的表达谱简单拼接合并,组合....


图2-2相似性网络融合算法[16]

图2-2相似性网络融合算法[16]

肯嗨菩跃卣螅?局噬鲜羌偕柰?缰械木植肯嗨菩员?网络中的全局相似性更可靠。对于全局相似性矩阵,它携带各个病人和其他每个病人相似度的全局信息,而局部相似性矩阵,仅为每个病人编码与k各最相似的病人的相似度。融合过程中总是以全局相似性矩阵为初始状态,以局部相似性矩阵为核矩阵,利用在全局网....


图2-4降噪自编码器

图2-4降噪自编码器

哈尔滨工业大学工学硕士学位论文-17-除,变成,此后再对进行编码与解码操作,最终得到恢复信号=(()),尽可能逼近未被破坏的数据。此训练过程中的误差从(,())变成了(,()),降噪自编码器的模型结构如图2-4所示。图2-4降噪自编码器2.5本章小结本章主要阐述了与分子分型课题后....



本文编号:4003999

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/4003999.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7d3b8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com