当前位置:主页 > 理工论文 > 生物学论文 >

MultCausal:一种利用多组学数据推断causal基因的统一方法

发布时间:2020-08-15 10:35
【摘要】:Causal基因的推断在理论和实践中都有重要意义,包括阐明生理过程尤其是人类疾病的机理,以及作物改良和疾病的治疗等,因此相应统计学方法的开发至关重要。现有的causal基因推断方法根据利用的数据类型和统计方法,大致可分三类:基于基因组的方法、基于其他组学数据和多组学数据的方法,以及基于网络的方法。方法繁杂多样,改进层出不穷,但仍然存在一些问题。一则这些方法无法同时形式化地容纳多种组学数据;二则这些方法并不孤立,但是这些方法间的联系并没有得到清楚阐释。鉴于此,本文开发了一个名为MultCausal的causal基因推断方法。主要思路是将多种组学数据以矩阵乘法的形式定义为设计矩阵Z,将Z矩阵带入线性模型运算求解,各基因P值取负对数,其相对大小即为causal基因的相对概率。为验证该方法的有效性,本文首先从现有三类方法中各选取一个代表(线性回归、GSMR、GeneRank),与MultCausal一起,在模拟数据和拟南芥开花时间数据集中加以比较。与三种方法相比,MultCausal效果有所提升,能够在控制假阳性率的同时保持较高的效力。随后本文探讨了MultCausal和三种方法的联系,形式上证明了MultCasual和线性模型、GSMR的等价性,并利用模拟证明了MultCausal和GeneRank的相关性。此外还从SVR的核技巧中得到的启发,将Z变成f(Z),显式地赋予设计矩阵非线性结构,从而提升了MultCausal的表现。
【学位授予单位】:华中农业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q811.4
【图文】:

示意图,原理,示意图,基因组信息


DNA ——> meDNA——>RNA ——> 蛋白质图 1.1 生物中信息流的一条路径Figure 1.1Apathway of information flow of life于此,各种从其他组学数据推断 causal gene 的方法也都想方设法利用,而不是单单利用某个组学数据(如 TWAS)。因而利用基因组学以外基本上都呈现出多组学的特点。这些方法和真正的多组学方法还是有本质不同。基因组信息的利用是组学数据,如果其他组学数据充分,可以不考虑基因组信息。而多组的组学数据共同纳入模型当中,各个组学数据都是不可或缺的(如孟。之,关键差别在于模型中是否包含基因组以外的变量。S 是 Gusev 等开发的一种方法,其主要原理如图 1.2 所示。

示意图,原理,示意图,最短路径


图 1.4 Camoco 原理示意图(引用自(Schaefer et al. 2018))Figure 1.4 Illustration of Camoco(Cited from Schaefer et al. 2018))1.3.2.3 利用网络扩散推断 causal 基因如果已经有了关于 causal 基因的部分信息,就能利用网络的模块性,推断更causal 基因的信息。这种方法和模块法十分类似,关键不同在于已经拥有 causal 因的部分知识,并以此作为出发点,试图获取更多 causal 基因的知识。网络扩散最简单的一种策略是“相似相邻”。即将已知 causal gene 的最近(direct neighbor)也视为 causal gene(Wang 2010)。但是这种方法的假阳性和假性都很高(Cowen et al. 2017)。最近邻法的一个变形是最短路径(shortest path)法。即放松最近邻的要求,不要最近,而是选择最短路径在一定范围(最近邻的最短路径为 1)内的 gene 视

示意图,模型,示意图,表型


代码可以在 https://github.com/Linghan-Jiang/MultCausal 找到。 MultCausal 的效果,首先构造模拟数据,预先假定关于 caus生表型,观察各方法能否有效地检测到假定的 causal 基因。hu et al. 2018)的工作,构造了两个由 SNP、基因和表型三个涉及的拟南芥数据参见 2.5 节。 1:causal 模型 = ( ) = ( )

【相似文献】

相关期刊论文 前10条

1 ;Relationship of causal effects in a causal chain and related inference[J];Science in China,Ser.A;2004年05期

2 郑忠国 ,童行伟 ,张艳艳;Identifiability of causal effect for a simple causal model[J];Science in China,Ser.A;2002年03期

3 江泽培;ON MARKOV MODELS OF RANDOM FIELDS[J];Acta Mathematicae Applicatae Sinica(English Series);1987年04期

4 ;Causal Relation Analysis of Economic Systems and the improvement of Syetem Dynamis(1)(2)[J];天水师专学报;1991年04期

5 Kun Zhang;Bernhard Scholkopf;Peter Spirtes;Clark Glymour;;Learning causality and causality-related learning:some recent progress[J];National Science Review;2018年01期

6 Soji Kaneyuki;Automorphism groups of causal symmetric spaces of Cayley type and bounded symmetric domains[J];Science in China,Ser.A;2005年S1期

7 ;Causal inference and related statistical methods[J];Baosteel Technical Research;2010年S1期

8 Yuesong WEI;Zheng TIAN;Yanting XIAO;;LEARNING MULTIVARIATE TIME SERIES CAUSAL GRAPHS BASED ON CONDITIONAL MUTUAL INFORMATION[J];Journal of Systems Science and Systems Engineering;2013年01期

9 ;Causal association rule mining methods based on fuzzy state description[J];Journal of Systems Engineering and Electronics;2006年01期

10 ;Indeterminacy Causal Inductive Automatic Reasoning Mechanism Based on Fuzzy State Description[J];Journal of Systems Engineering and Electronics;2002年02期

相关会议论文 前10条

1 Cichy B.;Galkowski K.;Rogers E.;Kummert A.;;Control of Discrete Linear Repetitive Processes with Non-causal Dynamics[A];第二十七届中国控制会议论文集[C];2008年

2 徐晓东;;When a causal relation was negated:An ERP investigation on concessive meaning in Chinese sentence comprehension[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年

3 John S.Ji;;Methodology:Using Directed Acyclic Graphs for Epidemiology Research[A];2018环境与健康学术会议--精准环境健康:跨学科合作的挑战论文汇编[C];2018年

4 ;Causal Relation Recognition between Sentence-based Events[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年

5 Ying Zhu;Yongyue Wei;Ruyang Zhang;Qianwen Shi;Xuesi Dong;Sipeng Shen;The Transdisciplinary Research in Cancer of the Lung(TRICL) Research Team;Rayjean J.Hung;Christopher Amos;Yang Zhao;David C.Christiani;Feng Chen;;Elevated platelet count appears to be associated with increased risk of lung cancer:a Mendelian Randomization Analysis[A];2017年中国卫生统计学学术年会论文集[C];2017年

6 徐向东;;Nonreductive Physicalism,Causation and Explanation[A];外国哲学(第18辑)[C];2005年

7 ;GENERAL PROBLEM OF OPTIMAL TRACKING THEORY FOR MACROECONOMIC SYSTEMS[A];1995年中国控制会议论文集(上)[C];1995年

8 Zhang Xiaoting;Gao Fei;Zhang Fang;Xie Yuan;Zhou Lin;Yuan Hongxia;Zhang Songbai;Li Honglian;;The complete genomic sequence of a novel megabirnavirus from Fusarium pseudograminearum,the causal agent of wheat crown rot[A];中国植物病理学会2018年学术年会论文集[C];2018年

9 ;Development of Multilevel Flow Model for Power Plant Process Fault Diagnosis[A];2009中国控制与决策会议论文集(1)[C];2009年

10 ;SDG-based Fault Diagnosis and Application Based on Reasoning Method of Granular Computing[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年

相关硕士学位论文 前6条

1 姜凌瀚;MultCausal:一种利用多组学数据推断causal基因的统一方法[D];华中农业大学;2019年

2 王杰瑛;有关causal算子的分数阶微分方程[D];扬州大学;2012年

3 李志芳;几类含causal算子的微分方程的收敛性[D];河北大学;2012年

4 金伟英;基于语料库的因果连接对比研究[D];上海交通大学;2007年

5 王婷;因果链注意窗理论在写作教学中的应用[D];重庆师范大学;2009年

6 朱雷;关于克里普克的历史因果命名理论研究[D];电子科技大学;2013年



本文编号:2793994

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2793994.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户24b27***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com