当前位置:主页 > 科技论文 > 基因论文 >

基于基因网络模型分析的癌症驱动基因识别算法研究

发布时间:2021-10-09 00:09
  癌症已经成为全球主要的公共卫生问题,同时也是主要的死亡原因之一。其中,癌症驱动基因的挖掘一直是一个重要的研究方向。同时,基于驱动基因的精准医学也是治疗癌症的重要手段。随着基因测序技术的进步,在过去数十年中已经报道了数以百万计的体细胞突变。但从这些数据中挖掘具有致癌突变的驱动基因仍然是一个极具挑战性的研究课题。为此,已经提出了许多高级算法来识别驱动基因,而在海量数据中将网络结构信息与生物信息相结合的尝试鲜有出现。本文基于复杂网络与机器学习方法研究癌症驱动基因的挖掘,创新性地结合了多种特征提取和对比分析的方法,分别从基因网络特征、基因属性特征、网络与属性的整合特征三方面综合挖掘基因特征,并通过不同角度的对比分析论证研究的可行性。最后,基于随机森林改进优化分类,揭示影响癌症发生发展的重要因素,进而识别出真正的潜在癌症驱动基因,为指导癌症的临床研究和驱动基因的挖掘提供指导依据。主要工作包括:(1)基于复杂网络理论的癌症基因网络分析。构建癌症基因网络,分析网络结构在癌症发生发展过程中的变化情况和挖掘基因的网络特征是本论文最先要研究的问题。对网络结构的分析,分别对比了Normal网络与Tumor网... 

【文章来源】:杭州师范大学浙江省

【文章页数】:59 页

【学位级别】:硕士

【部分图文】:

基于基因网络模型分析的癌症驱动基因识别算法研究


算法的建模流程和部分特征工程

节点,符号,计算方法,算法


杭州师范大学硕士学位论文2研究的理论基础9图2-1举例说明带符号随机漫步重启算法中r+与r-的定义图2-1中,本文以节点u为例,介绍节点u的计算方法。从图2-1可知,节点i与节点u的连边权值为+1,节点j与节点u的连边权值为-1,节点k与节点u的连边权值也为-1,又因为算法考虑了边权的影响,所以当值经过权值为-1的边时,其值的符号要取反;反之,经过权值为+1边时,其值保持不变。所以,节点u的ru+(t+1)得分由节点i的正值、节点j的负值,以及节点k的负值加权求和得到;同理,节点u的ru-(t+1)得分由节点i的负值、节点j的正值,以及节点k的正值加权求和得到。所以,在不考虑衰减条件的情况下,节点u的计算公式如下所示:ru+(t+1)=(1-c)(ri+(t)3+rj-(t)2+rk-(t)2)+c1(u=s),ru-(t+1)=(1-c)(ri-(t)3+rj+(t)2+rk+(t)2),ru=ru-(t+1)+ru+(t+1),而在实际网络中,信息在传递的过程中是存在信息衰减问题的,所以需要考虑平衡衰减的情况,论文给出了每个基因节点的得分r、抑制表达得分r-和促进表达得分r+的定义如下所示:r-=(1-c)[A-Tr++γA+Tr-+(1-β)A-Tr-],(2.6)r+=(1-c)[A+Tr++βA-Tr-+(1-γ)A-Tr-]+cq,(2.7)r=r++r-,(2.8)其中,A=D-1A,A为邻接矩阵,D为度矩阵,q为起始向量,c为重启概率;γ和β分别表示经过负权重边之后作用于正权重边和负权重边的平衡衰减因子,在

流程图,森林,流程图,模型


杭州师范大学硕士学位论文2研究的理论基础13图2-2随机森林(RF)的分类模型流程图随机森林构造决策树的步骤大致分为3步,如下所示:a)从包含N个样本的数据集中采用有放回抽样方式(bootstrap取样),重复抽取N次得到训练集,将没有抽到的样本作为预测集,用于评估模型的误差。b)假设样本特征维数为M。对于一个决策树,随机抽取m个特征(m<M),并且决策树的各个节点都是基于抽取的m特征确定。分裂过程中,根据随机选择的m个特征,计算出该决策树的最佳分裂方式。c)为了简化决策树模型,避免过拟合现象,根据模型的泛化能力需要对决策树进行剪枝操作。在本论文的研究中,通过构建基因互作网络挖掘基因的网络结构特征,同时整合基因生物信息特征得到特征矩阵,并作为算法的输入。(2)SVM算法支持向量机作为一种有监督学习算法被广泛的应用于分类问题的研究,它是基于统计学理论的VC维理论和结构风险最小原理建立的模型。SVM根据有限的样本信息在模型的复杂度和学习能力之间寻求最佳的折中以获得最好的泛化能力[54-56]。如图2-3所示,SVM在建立模型的过程中是在不断寻找最优超平面,同时要求边际最大化。


本文编号:3425245

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3425245.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户31205***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com