基于深度学习和组学数据融合的乳腺癌生存期预测研究
发布时间:2021-01-07 16:28
近年来,乳腺癌的发病率和死亡率持续升高,对乳腺癌患者进行精准的生存期预测已成为癌症研究领域的热点问题。准确的生存期预测能够为医务工作者和病人家属提供科学的治疗凭据,同时避免患者过度治疗所造成的医疗资源浪费。乳腺癌是一种恶性肿瘤疾病,它的产生和发展与基因密切相关。随着生物测序技术的进步,生物信息学领域积累了大规模组学数据,这为研究者全方位了解生物学过程夯实了基础。在乳腺癌生存期预测研究中,基因表达数据从微观生物学层面反映肿瘤的生物特性,对癌症预后和治疗有重要的应用价值。临床数据包含了丰富的病理学特征,为乳腺癌患者的生存期预测提供理论依据。如何有效地融合基因表达数据和临床数据,更准确地预测乳腺癌生存期,是癌症生存期预测研究领域中亟需解决的问题。然而,现有的乳腺癌生存期预测模型,往往使用单一的特征选择方法对基因表达数据进行特征提取,再进行简单的特征拼接融合,这不仅容易丢失重要的基因信息,还忽略了组学数据间的关联。因此这类方法具有一定的局限性。本文在现有乳腺癌生存期预测研究的基础上,提出了基于深度学习和组学数据融合的乳腺癌生存期预测模型。首先,通过非负矩阵分解的改进算法提取出与乳腺癌生存期相关...
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
本文研究内容框架图
就诰虻榷喔鲇τ贸【耙踩〉昧私虾玫男Ч?O旅娼?蛞?樯苌疃妊?爸兄?流的网络模型和相关技术。2.2.1深度神经网络作为常用的深度学习框架,深度神经网络(DeepNeuralNetworks,DNN),可看作一个有很多隐藏层的感知机。其中,相邻两层网络节点的连接方式为全连接。深度神经网络相较于浅层神经网络在建模方面更具有优势,它能够有效处理复杂的非线性系统,并且利用网络中的隐藏层对数据进行高层次抽象,使整个模型的泛化能力得到提升。按不同层的位置划分,DNN内部的神经网络层可以分为:输入层、隐藏层和输出层。其结构如图2.1所示:图2.1深度神经网络示意图其中,数据通过输入层传入模型,模型内部则由多个隐藏层构成,每个隐藏层包含多个神经元。隐藏层的主要作用是处理上一层传递过来的数据信息,并且将信息传递到下一层。模型的最后一层为输出层,输出层的维度由任务的特性决定。在感知机中,各层的神经元通过全连接的方式组织在一起,将信息由前往后
第2章相关理论与技术11化的卷积神经网络架构图。图2.2卷积神经网络架构图从图2.2中可以看出,卷积神经网络主要由若干个卷积层、池化层和全连接层组成。其中,前几个网络层主要是以卷积层和池化层为主,特征图将卷积层中的各个单元组织在一起。特征图中的每一个计算单元都通过滤波器连接上一个特征图中对应的局部块,并将局部块中的权值进行加权求和,所得结果传递给非线性函数。该函数一般采用激活函数,如sigmoid函数。同一张特征图上的神经元使用的过滤器都是相同的,而其它各层特征图所采用的过滤器略有差异。这样的处理方式对于多维数据更具有优势。在多维数据中,每一个像素点与其周围像素点的值互相关联,这样能够得到图像中重要的局部特征。此外,其它位置的局部特征之间略有差异,使得不同位置的神经元均可以对权值进行共享。卷积层的主要作用是对局部特征进行提取,池化层的作用是对相近的特征进行整合。通常,池化层采用最大池化或者平均池化对特征图中的局部块进行处理,在读取数据时通过移动一行或一列的方式进行操作,这样的方式能够有效降低输入数据的维度以及保证数据的移动不变性。通过卷积层、池化层、非线性变换的计算和最后的全连接操作,神经网络能够直接对输入数据进行特征提龋如果是处理分类任务,可以在最后加入一个分类层,这样就实现了一个完整的神经网络分类器。2.2.3注意力机制介绍注意力(Attention)机制是深度学习领域的一种新技术。它的主要思想是度量键(Key)和请求(Query)之间的相似度,若某一时刻的输入与目标状态越相似,那么这一时刻的输入所对应的权重就会越大,说明当前的输出更依赖于该时刻的输入。例如,我们翻译“机器学习”这一词语。当翻译成“machinelearning”的时候,我们希望模型更加?
【参考文献】:
期刊论文
[1]基于多组学数据融合构建乳腺癌生存预测模型[J]. 齐惠颖,江雨荷. 数据分析与知识发现. 2019(08)
[2]基于层级规则树的跨平台基因表达数据分类[J]. 蔡瑞初,侯永杰,郝志峰. 计算机工程. 2019(07)
[3]基于混淆矩阵的证据可靠性评估[J]. 宋亚飞,王晓丹,雷蕾. 系统工程与电子技术. 2015(04)
[4]系统生物学研究中不同组学数据的整合[J]. 刘伟,朱云平,贺福初. 中国生物化学与分子生物学报. 2007(12)
[5]纵向数据分析方法在中医临床疗效评价中的应用浅析[J]. 谢雁鸣,徐桂琴. 中国中医基础医学杂志. 2007(09)
硕士论文
[1]基于乳腺癌基因表达数据的特征选择算法研究[D]. 张颖.西南大学 2019
本文编号:2962872
【文章来源】:西南大学重庆市 211工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
本文研究内容框架图
就诰虻榷喔鲇τ贸【耙踩〉昧私虾玫男Ч?O旅娼?蛞?樯苌疃妊?爸兄?流的网络模型和相关技术。2.2.1深度神经网络作为常用的深度学习框架,深度神经网络(DeepNeuralNetworks,DNN),可看作一个有很多隐藏层的感知机。其中,相邻两层网络节点的连接方式为全连接。深度神经网络相较于浅层神经网络在建模方面更具有优势,它能够有效处理复杂的非线性系统,并且利用网络中的隐藏层对数据进行高层次抽象,使整个模型的泛化能力得到提升。按不同层的位置划分,DNN内部的神经网络层可以分为:输入层、隐藏层和输出层。其结构如图2.1所示:图2.1深度神经网络示意图其中,数据通过输入层传入模型,模型内部则由多个隐藏层构成,每个隐藏层包含多个神经元。隐藏层的主要作用是处理上一层传递过来的数据信息,并且将信息传递到下一层。模型的最后一层为输出层,输出层的维度由任务的特性决定。在感知机中,各层的神经元通过全连接的方式组织在一起,将信息由前往后
第2章相关理论与技术11化的卷积神经网络架构图。图2.2卷积神经网络架构图从图2.2中可以看出,卷积神经网络主要由若干个卷积层、池化层和全连接层组成。其中,前几个网络层主要是以卷积层和池化层为主,特征图将卷积层中的各个单元组织在一起。特征图中的每一个计算单元都通过滤波器连接上一个特征图中对应的局部块,并将局部块中的权值进行加权求和,所得结果传递给非线性函数。该函数一般采用激活函数,如sigmoid函数。同一张特征图上的神经元使用的过滤器都是相同的,而其它各层特征图所采用的过滤器略有差异。这样的处理方式对于多维数据更具有优势。在多维数据中,每一个像素点与其周围像素点的值互相关联,这样能够得到图像中重要的局部特征。此外,其它位置的局部特征之间略有差异,使得不同位置的神经元均可以对权值进行共享。卷积层的主要作用是对局部特征进行提取,池化层的作用是对相近的特征进行整合。通常,池化层采用最大池化或者平均池化对特征图中的局部块进行处理,在读取数据时通过移动一行或一列的方式进行操作,这样的方式能够有效降低输入数据的维度以及保证数据的移动不变性。通过卷积层、池化层、非线性变换的计算和最后的全连接操作,神经网络能够直接对输入数据进行特征提龋如果是处理分类任务,可以在最后加入一个分类层,这样就实现了一个完整的神经网络分类器。2.2.3注意力机制介绍注意力(Attention)机制是深度学习领域的一种新技术。它的主要思想是度量键(Key)和请求(Query)之间的相似度,若某一时刻的输入与目标状态越相似,那么这一时刻的输入所对应的权重就会越大,说明当前的输出更依赖于该时刻的输入。例如,我们翻译“机器学习”这一词语。当翻译成“machinelearning”的时候,我们希望模型更加?
【参考文献】:
期刊论文
[1]基于多组学数据融合构建乳腺癌生存预测模型[J]. 齐惠颖,江雨荷. 数据分析与知识发现. 2019(08)
[2]基于层级规则树的跨平台基因表达数据分类[J]. 蔡瑞初,侯永杰,郝志峰. 计算机工程. 2019(07)
[3]基于混淆矩阵的证据可靠性评估[J]. 宋亚飞,王晓丹,雷蕾. 系统工程与电子技术. 2015(04)
[4]系统生物学研究中不同组学数据的整合[J]. 刘伟,朱云平,贺福初. 中国生物化学与分子生物学报. 2007(12)
[5]纵向数据分析方法在中医临床疗效评价中的应用浅析[J]. 谢雁鸣,徐桂琴. 中国中医基础医学杂志. 2007(09)
硕士论文
[1]基于乳腺癌基因表达数据的特征选择算法研究[D]. 张颖.西南大学 2019
本文编号:2962872
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2962872.html