基于粒度计算的动态生物网络建模及应用
发布时间:2021-07-02 18:41
生物大数据使得关于生物机制的研究可以从数据分析的角度入手,多方面揭示分子调控机制。然而海量的高通量数据也给数据分析带来了难度。与此同时,生物功能的复杂性也要求使用更合适的建模方式,以准确地描述分子机制内部复杂的结构。网络方法能够描述分子相互作用,以图的形式展现分子调控系统。而粒度计算理论广泛应用于提取系统结构,有助于从不同层次理解分子如何通过协同实现具体的生命过程。本文基于粗粒化思想,结合网络分析方法认识疾病动态发展过程中的分子调控机制,主要探讨了肺腺癌预测基因的选取、小鼠Ⅱ型糖尿病发展机制和结肠癌血行转移过程中循环癌细胞(CTC)、自然杀伤细胞(NK细胞)和血小板之间的通讯网络。主要内容如下:在第二章中,为了提取预测基因用于对肿瘤与正常样本进行分类,本章提出一种基于格兰杰因果关系检验和逐步特征选择的预测基因选择方法,其设计目标是最大限度提高分类精度和减少预测因子数量。首先,基于甲基化、基因表达和miRNA表达数据构建基因相互作用网络,并通过差异表达分析获得差异基因。进一步,通过网络分析,选取中心节点作为特征基因。最后,利用格兰杰因果检验和皮尔逊相关检验对特征基因进行筛选;提出基于随机...
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
IL1B基因在不同组织中的表达差异性
中起到关键作用的配体-受体对。最后利用逐步特征选择算法识别预测基因,用于分类正常样本和发生转移的结肠癌样本。第五章进行总结与展望,指出可以继续加强和补充的部分,为进一步研究提供建议。1.4.2创新点结合基因表达数据,本文以粒度计算思想为指导,结合网络手段对数据进行分析,对疾病发病与演变的潜在分子机制进行了探索。本文完成了从单层网络、动态网络直至多层网络(具体为组织/细胞间通讯网络)的研究过程,主要创新点如下:(1)基于随机森林算法,提出逐步特征选择算法识别预测基因,该算法能够保证所得的图1-2文章组织结构
第二章基于差异基因互作网络的预测基因选择11控方向,即将原本的无向网络转化为具有因果关系的有向网络。在这样的因果网络中,受到调控的基因的作用可以被它的调控基因所取代,因此,只需要找到在整个网络中发挥源头作用的全局调控基因,即可掌握网络中的关键调控信息。2.2全局调控基因搜索算法具体地,确定以下两中基因为网络中的全局调控基因:一种是入度为0的基因;另一种为与其他基因构成独立的闭环的基因,具体如图2-2所示。首先确定入度为0的基因选为全局调控基因,随后逐步沿着有向网络的方向逐步搜寻并删除受其调控的基因。当整个过程结束之后,第二种情况所描述的基因永远无法被搜寻到。因此循环结束后剩余的基因也全部选为全局调控基因。据图2-2所示,在图2-2(a)中,A是C和D的调控基因,C同时是A和G的受控基因,且C的入度和出度均不为0,C在网络中标为绿色;H是一个单独的节点。在图2-2(b)中,B、E和I的入度都等于1,它们构成了独立的闭环。对这样一个包含9个节点的网络进行上述全局调控基因搜索算法,最终得到的全局调控基因即为A、G、H、B、E和I(即标为红色的节点)。图2-1格兰杰因果检验过程图2-2全局调控基因搜索算法
【参考文献】:
期刊论文
[1]Ketogenic diet versus ketoacidosis: what determines the influence of ketone bodies on neurons?[J]. Sergei V.Fedorovich,Polina P.Voronina,Tatyana V.Waseem. Neural Regeneration Research. 2018(12)
[2]基于粒度空间的最小生成树分类算法[J]. 孙梦梦,唐旭清. 南京大学学报(自然科学). 2017(05)
[3]基于粗粒化的流感病毒蛋白进化树构建[J]. 李阳,唐旭清. 模式识别与人工智能. 2016(10)
[4]系统生物学与生物网络研究[J]. 谭璐,姜璐. 复杂系统与复杂性科学. 2005(04)
[5]生物信息学:生物实验数据和计算技术结合的新领域[J]. 欧阳曙光,贺福初. 科学通报. 1999(14)
本文编号:3261013
【文章来源】:江南大学江苏省 211工程院校 教育部直属院校
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
IL1B基因在不同组织中的表达差异性
中起到关键作用的配体-受体对。最后利用逐步特征选择算法识别预测基因,用于分类正常样本和发生转移的结肠癌样本。第五章进行总结与展望,指出可以继续加强和补充的部分,为进一步研究提供建议。1.4.2创新点结合基因表达数据,本文以粒度计算思想为指导,结合网络手段对数据进行分析,对疾病发病与演变的潜在分子机制进行了探索。本文完成了从单层网络、动态网络直至多层网络(具体为组织/细胞间通讯网络)的研究过程,主要创新点如下:(1)基于随机森林算法,提出逐步特征选择算法识别预测基因,该算法能够保证所得的图1-2文章组织结构
第二章基于差异基因互作网络的预测基因选择11控方向,即将原本的无向网络转化为具有因果关系的有向网络。在这样的因果网络中,受到调控的基因的作用可以被它的调控基因所取代,因此,只需要找到在整个网络中发挥源头作用的全局调控基因,即可掌握网络中的关键调控信息。2.2全局调控基因搜索算法具体地,确定以下两中基因为网络中的全局调控基因:一种是入度为0的基因;另一种为与其他基因构成独立的闭环的基因,具体如图2-2所示。首先确定入度为0的基因选为全局调控基因,随后逐步沿着有向网络的方向逐步搜寻并删除受其调控的基因。当整个过程结束之后,第二种情况所描述的基因永远无法被搜寻到。因此循环结束后剩余的基因也全部选为全局调控基因。据图2-2所示,在图2-2(a)中,A是C和D的调控基因,C同时是A和G的受控基因,且C的入度和出度均不为0,C在网络中标为绿色;H是一个单独的节点。在图2-2(b)中,B、E和I的入度都等于1,它们构成了独立的闭环。对这样一个包含9个节点的网络进行上述全局调控基因搜索算法,最终得到的全局调控基因即为A、G、H、B、E和I(即标为红色的节点)。图2-1格兰杰因果检验过程图2-2全局调控基因搜索算法
【参考文献】:
期刊论文
[1]Ketogenic diet versus ketoacidosis: what determines the influence of ketone bodies on neurons?[J]. Sergei V.Fedorovich,Polina P.Voronina,Tatyana V.Waseem. Neural Regeneration Research. 2018(12)
[2]基于粒度空间的最小生成树分类算法[J]. 孙梦梦,唐旭清. 南京大学学报(自然科学). 2017(05)
[3]基于粗粒化的流感病毒蛋白进化树构建[J]. 李阳,唐旭清. 模式识别与人工智能. 2016(10)
[4]系统生物学与生物网络研究[J]. 谭璐,姜璐. 复杂系统与复杂性科学. 2005(04)
[5]生物信息学:生物实验数据和计算技术结合的新领域[J]. 欧阳曙光,贺福初. 科学通报. 1999(14)
本文编号:3261013
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3261013.html