基于样本特异性的差异网络及其在个人性状中的应用
发布时间:2021-01-13 13:51
以癌症为代表的复杂疾病长期以来一直是困扰人类多年的难题,威胁着人类的生命安全。随着各种不同组学的数据大量涌现,癌症相关的一系列课题取得了巨大的突破,为研究疾病复杂性与药物治疗提供了重要的机遇与挑战。基因芯片技术是目前研究人类基因组的最强有力的工具,基因芯片数据分析已成为生物信息学的一个重要分支。通过比较疾病与基因表达调控间的关系,对比正常组织与癌症组织表达谱的差异,可以更好地了解疾病发生的分子基础。对系统性、针对性的癌症标记物研究,癌症患者的个性化治疗与精准治疗,起着非常关键的作用。在本篇论文中,特异性差异网络(SSDN)有助于识别单样本潜在的驱动基因。为了建立SSDN,我们首先需要建立SSN。而这一过程需要构建参考网络,更需要考虑参考网络中相关系数的一致性。参考网络的选择与差异网络的建立在该方向的研究中至关重要。但是,由于癌症病理的复杂性,目前尚未有有效的方法证实,基于不同标准的参考网络与差异网络能够系统地对应,即参考网络的选择是否会影响差异网络的构建。本文从理论上证实了参考网络相关系数的大小关系在以下两种情况下是一致的:1、参考样本数量非常大;2、参考样本服从同一分布。基于这一理论...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
图1-1基因表达过程中的调控机理??构建基因调控网络,可以借助基因芯片技术,揭示生物体基因组的表达调控??
山东大学硕士学位论文??参考网络(图3-1)。从患者(样本A:)的癌症组织中获得疾病样本(&)添加到??参考网络中,得到扰动的疾病网络(图3-1A)。通过计算扰动网络和参考网络不??同边(基因对)之间的相关关系,获得样本灸的疾病网络(图3-1B),这一疾病??网络也被称为SSN[27】的疾病网络。同时,从患者(样本G的正常组织中获得正??常样本(&)添加到参考网络,用同样的方法,能够得到扰动的正常网络(图3-??1A)和样本的正常网络(图3-1B),这一正常网络也被称为SSN的正常网络。??其中,疾病样本来自患者的肿瘤组织,正常样本(对照样本)来自同一患者的癌??旁组织。而疾病网络和正常网络之间的差异性很可能来自于与癌症相关的基因。??如果两个网络之间的结构发生明显变化,那么引起这种变化的基因极有可能与癌??症相关。相反地,如果基因在两个网络之间变化很小,则可能是与癌症无关的基??因。因此,通过获得疾病网络和正常网络之间的差异性,例如,若疾病网络中的??边(基因对)不在正常网络中,则保留这条边,反之则删除这条边,这样可以得??到样本灸的特异性差异网络(sample-specific?differential?network,简记为SSDN)。????SSN:?sample-specific?iietworic?i??'丨一^-^\?i?SSDN:?sample-specific?ditTa-ential?network?J??Individual?di>casc?vample^?S?i?\??!,謂一ig翻卜??_■■驪??PerJurbtddiwavc?i?广)二、、——1??〇?t??SampieS.?^
山东大学硕士学位论文??1A)。这说明参考网路的分布差异越大,单样本相关系数的一致性就越低。图4-??1B和图4-1C也有相同的趋势。对于两个参考网络,均由^=1和5=1的正态分布??产生,且样本数量为100-1000时,一致性比例为95.64%?(图4-1A),当样本数??增至1000-10000时,一致性比例为99.3%(图4-1B),当样本数增至10000-100000??时,一致性比例增至99.64%?(图4-1C)。这表明,随着样本数量的逐渐増多时,??&PCC的一致性比例也在逐渐升高。??1?^?gPfcl?-?^??锥?ar2?js=3?ii"A?H'?^?^??参考释络的均懷?m?参考鳄络的均s??6*2参考羯^纖S?U00,_?6*!参考觸翁賴为I職1觸??C??f?,?^1#ll?s??丨欄J??rf?OJ??iP=l?si=2?p*3?fjss4??^?mmmm??S=1费考舜络的结獨为丨100034孩HXS】??图4-1随机生成不同均值的正态分布??两个参考网络由不同分布产生时(正态分布,均勾分布,泊松分布,几何分??布),也能得到相同结论(图4-2)。例如,当两个参考网络样本数为100-1000,??且都由正态分布产生时,一致性比例为95.58%?(图4-2A)。当参考网络样本数为??100-1000,分别由正态分布和均匀分布产生时,一致性比例为56.23%(图4-2A)。??当参考网络样本数为100-1000,分别由正态分布和泊松分布产生时,一致性比例??为10.23%?(图4-2A)。当参考网络样本数为100-1000,分别由正态分布和几何分??布产生时,一致
本文编号:2974978
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:56 页
【学位级别】:硕士
【部分图文】:
图1-1基因表达过程中的调控机理??构建基因调控网络,可以借助基因芯片技术,揭示生物体基因组的表达调控??
山东大学硕士学位论文??参考网络(图3-1)。从患者(样本A:)的癌症组织中获得疾病样本(&)添加到??参考网络中,得到扰动的疾病网络(图3-1A)。通过计算扰动网络和参考网络不??同边(基因对)之间的相关关系,获得样本灸的疾病网络(图3-1B),这一疾病??网络也被称为SSN[27】的疾病网络。同时,从患者(样本G的正常组织中获得正??常样本(&)添加到参考网络,用同样的方法,能够得到扰动的正常网络(图3-??1A)和样本的正常网络(图3-1B),这一正常网络也被称为SSN的正常网络。??其中,疾病样本来自患者的肿瘤组织,正常样本(对照样本)来自同一患者的癌??旁组织。而疾病网络和正常网络之间的差异性很可能来自于与癌症相关的基因。??如果两个网络之间的结构发生明显变化,那么引起这种变化的基因极有可能与癌??症相关。相反地,如果基因在两个网络之间变化很小,则可能是与癌症无关的基??因。因此,通过获得疾病网络和正常网络之间的差异性,例如,若疾病网络中的??边(基因对)不在正常网络中,则保留这条边,反之则删除这条边,这样可以得??到样本灸的特异性差异网络(sample-specific?differential?network,简记为SSDN)。????SSN:?sample-specific?iietworic?i??'丨一^-^\?i?SSDN:?sample-specific?ditTa-ential?network?J??Individual?di>casc?vample^?S?i?\??!,謂一ig翻卜??_■■驪??PerJurbtddiwavc?i?广)二、、——1??〇?t??SampieS.?^
山东大学硕士学位论文??1A)。这说明参考网路的分布差异越大,单样本相关系数的一致性就越低。图4-??1B和图4-1C也有相同的趋势。对于两个参考网络,均由^=1和5=1的正态分布??产生,且样本数量为100-1000时,一致性比例为95.64%?(图4-1A),当样本数??增至1000-10000时,一致性比例为99.3%(图4-1B),当样本数增至10000-100000??时,一致性比例增至99.64%?(图4-1C)。这表明,随着样本数量的逐渐増多时,??&PCC的一致性比例也在逐渐升高。??1?^?gPfcl?-?^??锥?ar2?js=3?ii"A?H'?^?^??参考释络的均懷?m?参考鳄络的均s??6*2参考羯^纖S?U00,_?6*!参考觸翁賴为I職1觸??C??f?,?^1#ll?s??丨欄J??rf?OJ??iP=l?si=2?p*3?fjss4??^?mmmm??S=1费考舜络的结獨为丨100034孩HXS】??图4-1随机生成不同均值的正态分布??两个参考网络由不同分布产生时(正态分布,均勾分布,泊松分布,几何分??布),也能得到相同结论(图4-2)。例如,当两个参考网络样本数为100-1000,??且都由正态分布产生时,一致性比例为95.58%?(图4-2A)。当参考网络样本数为??100-1000,分别由正态分布和均匀分布产生时,一致性比例为56.23%(图4-2A)。??当参考网络样本数为100-1000,分别由正态分布和泊松分布产生时,一致性比例??为10.23%?(图4-2A)。当参考网络样本数为100-1000,分别由正态分布和几何分??布产生时,一致
本文编号:2974978
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2974978.html
最近更新
教材专著