肿瘤相关的miRNA调控模块识别方法研究
发布时间:2020-08-11 15:09
【摘要】:MicroRNAs(miRNAs)是一类由内源基因编码的非编码蛋白单链RNA分子,长度约为20-24个核苷酸。它们广泛的存在于真核生物中,可引起mRNA的降解或者抑制mRNA的转录,并在生长周期、细胞分化、细胞增殖等多种重要生物过程中扮演着重要的角色。由于临床及生物实验在技术、时间等方面的限制,miRNA的大部分精确功能还处于未知状态。因此,利用计算机方法对相关的生物数据进行分析,成为研究miRNA的方法之一。目前,许多识别miRNA调控模块的计算方法已经被提出。这些方法或需要预先定义模块的个数;或需要预先定义的参数过多,而这些参数可能难以优化;或只从单个分子间关系的角度进行模块挖掘;或未考虑同一分子家族成员间的关联性。基于上述分析,本文围绕着miRNA与mRNA间调控关系的模块性进行了研究,提出了两种miRNA调控模块的识别方法,主要工作如下:1.提出一种基于模糊聚类的方法,识别肿瘤相关的miRNA调控模块(MIMPFC)。该方法首先采用Phase-Only Correlation(POC)方法构建miRNA-mRNA的交互网络;然后修改Rough-Fuzzy Clustering(RFC)方法,并利用改进后的RFC方法进行聚类,得到miRNA类与mRNA类;最后使用Canonical Correlation Analysis(CCA)方法分析每个miRNA类与每个mRNA类之间的关系,提取相关性较高的两个类别组合成一个模块。MIMPFC方法从miRNA类与mRNA类间的角度进行分析,且只根据miRNA与mRNA基因表达谱数据本身的特性进行分析。它以真实的生物关系为假设进行实验模拟,且不需要预先定义调控模块的个数,识别过程中出现的参数可以通过公式计算,实验结果不受输入数据集中差异数据的干扰。实验结果表明,MIMPFC方法挖掘出的调控模块在癌症通路中显著富集。2.提出一种结合多类数据源的方法,识别肿瘤相关的miRNA调控模块(GIFMRM)。该方法首先利用miRNA与mRNA基因表达谱及miRNA家族信息构建miRNA-miRNA相似性网络,在该网络的基础上,对miRNA进行聚类;然后计算每个mRNA被分配到每个miRNA类的概率,以此概率为依据,将符合阀值的mRNA分配到相应的miRNA类中,组成一个模块。该方法首次考虑同一家族成员间的生物作用关联性对miRNA调控模块识别的影响,在这之前未有人把miRNA家族信息作为miRNA调控网络识别的先验信息。且GIFMRM方法,不再使用聚类的方法分配mRNA,而是采用相关性概率计算的方法分配mRNA。实验结果表明,该识别方法挖掘出的miRNA调控模块在癌症通路中显著富集。
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R73-3
【图文】:
图 2.1 当前 miRNA-mRNA 调控关系识别方法的共同框架[39]表 2.1 miRNA 靶基因预测算法算法类型 名称基于规则驱动的预测算法TargetScan miRNAda PITA DIANA-microT RNAhybrid MicroInspector MovingTargets Nucleus基于数据驱动的预测算法PicTar miTarget mirTarget RNA22 TargetBoost GenMiR3 miRNA 调控关系预测方法研究诸如相关性分析 回归分析 贝叶斯参数学习等方法在预测 miRNA 调控关上已经取得显著的成效 这些方法预测的准则是:如果 miRNA 调控一个基因,
硕士学位论文方法 IRFC 分别对 miRNAs 和 mRNAs 聚类 第三步,从上一步中得的 miRNA 类 mRNA 类中选出其元素个数小于阈值的类,然后分别计算这些类中的 miRNAs 与每个 miRNA 类的关系,mRNAs 与每个 mRNA 类的关联系数,根据得到的关联系数,进行第二次聚类;(3)第三阶段,采用 CCA 计算每个 miRNA 类与每个 mRNA 类的相关系数,提取具有高相关系数及低 p-value值的 miRNA类和 mRNA类,组合成一个 MMRMs 具体流程如图 3.1 所示
在公式(3.3)中,Count(C )表示第 j 类中元素的个数,1 ≤ ≤ 且 后得到的类别数目 在公式(3.4)中, ( ,Ci)是 与所有类的隶属度中属度值 如果 ( , ) ( , )≥ 2, 就属于 的边界区域和 的边见图 3.2,RFC 中的概念图),此时 不属于任何一个类的下近似,即把来所在的类中删除;如果 ( , ) ( , ) 2, 就属于下近似,即 2的计算公式定义如下: 1∑ ( , ) ( , )≠1 ( ( , ) 1) 1∑ ( , ) ≠ ( ( , ) 1),( , ) ∈ ( , ) 1 2∑ ( , ) ( , )≠1 ( ( , ) 1) 2∑ ( , ) ≠ ( ( , ) 2),( , ) ∈ ( , ) 2 ( )表示满足条件的值的个数
本文编号:2789226
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R73-3
【图文】:
图 2.1 当前 miRNA-mRNA 调控关系识别方法的共同框架[39]表 2.1 miRNA 靶基因预测算法算法类型 名称基于规则驱动的预测算法TargetScan miRNAda PITA DIANA-microT RNAhybrid MicroInspector MovingTargets Nucleus基于数据驱动的预测算法PicTar miTarget mirTarget RNA22 TargetBoost GenMiR3 miRNA 调控关系预测方法研究诸如相关性分析 回归分析 贝叶斯参数学习等方法在预测 miRNA 调控关上已经取得显著的成效 这些方法预测的准则是:如果 miRNA 调控一个基因,
硕士学位论文方法 IRFC 分别对 miRNAs 和 mRNAs 聚类 第三步,从上一步中得的 miRNA 类 mRNA 类中选出其元素个数小于阈值的类,然后分别计算这些类中的 miRNAs 与每个 miRNA 类的关系,mRNAs 与每个 mRNA 类的关联系数,根据得到的关联系数,进行第二次聚类;(3)第三阶段,采用 CCA 计算每个 miRNA 类与每个 mRNA 类的相关系数,提取具有高相关系数及低 p-value值的 miRNA类和 mRNA类,组合成一个 MMRMs 具体流程如图 3.1 所示
在公式(3.3)中,Count(C )表示第 j 类中元素的个数,1 ≤ ≤ 且 后得到的类别数目 在公式(3.4)中, ( ,Ci)是 与所有类的隶属度中属度值 如果 ( , ) ( , )≥ 2, 就属于 的边界区域和 的边见图 3.2,RFC 中的概念图),此时 不属于任何一个类的下近似,即把来所在的类中删除;如果 ( , ) ( , ) 2, 就属于下近似,即 2的计算公式定义如下: 1∑ ( , ) ( , )≠1 ( ( , ) 1) 1∑ ( , ) ≠ ( ( , ) 1),( , ) ∈ ( , ) 1 2∑ ( , ) ( , )≠1 ( ( , ) 1) 2∑ ( , ) ≠ ( ( , ) 2),( , ) ∈ ( , ) 2 ( )表示满足条件的值的个数
【参考文献】
相关期刊论文 前2条
1 张俊鹏;孙少平;贺建峰;马磊;;miRNA研究的计算机方法[J];计算机应用与软件;2012年01期
2 袁敏;沈南;唐元家;;B细胞分化成熟的microRNA研究进展[J];现代免疫学;2009年02期
相关博士学位论文 前1条
1 徐江锋;SIN1通过调控上皮细胞间质转化促进肝细胞癌侵袭转移[D];中南大学;2013年
本文编号:2789226
本文链接:https://www.wllwen.com/yixuelunwen/zlx/2789226.html