当前位置:主页 > 科技论文 > 数学论文 >

基于Granger因果检验的基因调控网络构建算法

发布时间:2018-03-05 12:12

  本文选题:时序基因表达数据 切入点:基因调控网络 出处:《西安电子科技大学》2015年硕士论文 论文类型:学位论文


【摘要】:基因芯片技术的应用使得快速获得大量基因表达数据成为可能,进而为生物信息学研究提供了必需的数据库,极大地推动了基因数据的研究。细胞的生命活动与细胞内所有基因的表达水平有关,一个基因的表达并不是孤立的,它的表达水平不仅受到其它基因的影响,同时还可能影响其它基因的表达水平,这些基因间的相互调控关系构成了基因调控网络。同样地,基因调控网络是众多基因复杂调控的体现。对基因调控网络进行研究能够帮助我们了解基因与基因之间或者基因及其产物之间的相互关系;对疾病基因调控网络的分析,可以指导药物研发和临床合理用药,从而为复杂疾病的诊断与治疗提供有价值的信息。所以重构和分析基因调控网络是十分必要的。传统的调控网络构建方法大多是借助各种网络模型,如布尔网络模型和贝叶斯网络模型等等,但这些模型忽略了基因表达数据的时序性特征。本文致力于研究利用时序基因表达数据重构基因调控网络的算法,并提出基于Granger因果关系的基因调控网络构建新算法,以展现基因间的因果调控关系。算法的提出基于以下基础:(1)时序基因表达数据作为一种特殊的时序数据,时序数据的分析处理方法同样适用于基因表达数据的处理。(2)基因的表达水平是自身表达与基因间相互调控的体现,解读基因的表达水平可以分析基因间的调控关系。同时,Granger因果关系是分析时序变量因果性的有效工具,可以应用于基因表达水平的分析。本文主要涉及自回归模型和Granger因果关系等理论知识,我们将由多基因组成的时序基因数据出发,利用自回归模型抽取基因前后时间表达值互相依赖的动态特性,并利用谱分析的知识将时序数据映射到频域达到降低维度和消除时间对因果性的影响,通过计算基因间两两Granger因果调控关系,建立包含所有基因在内的基于Granger因果关系的基因调控网络。通过在大肠杆菌和酵母菌模拟数据上实验,验证了自回归模型适用于时序基因表达数据。在酿酒酵母菌真实基因表达数据上实验,与NIR算法比较基于Granger因果关系的构建算法具有较高的识别率。
[Abstract]:The application of gene chip technology makes it possible to obtain a large number of gene expression data quickly, which provides the necessary database for bioinformatics research. The activity of cell life is related to the level of expression of all genes in the cell. The expression of one gene is not isolated, and its expression level is not only affected by other genes. It may also affect the level of expression of other genes, which form a genetic regulatory network. Gene regulation network is the embodiment of many gene complex regulation. The study of gene regulation network can help us understand the relationship between gene and gene or gene and its products, and analyze disease gene regulation network. Can guide drug research and development and clinical rational use, Thus providing valuable information for the diagnosis and treatment of complex diseases. So it is very necessary to reconstruct and analyze gene regulatory networks. Such as Boolean network model and Bayesian network model, but these models ignore the temporal characteristics of gene expression data. A new algorithm based on Granger causality is proposed to show the relationship between genes. The algorithm is based on the following basic: 1) temporal gene expression data as a special temporal data. The analysis and processing method of time series data is also suitable for the processing of gene expression data. The expression level of gene is the embodiment of self-expression and interregulation between genes. The level of gene expression can be used to analyze the regulatory relationship between genes, and Granger causality is an effective tool to analyze the causality of temporal variables. It can be applied to the analysis of gene expression level. This paper mainly involves the autoregressive model and Granger causality and other theoretical knowledge, we will be composed of multiple gene sequence gene data, The autoregressive model is used to extract the dynamic characteristics of interdependency between time expression values before and after gene expression, and the time series data are mapped to frequency domain to reduce the dimension and eliminate the effect of time on causality by using the knowledge of spectral analysis. By calculating the Granger causality control relationship between genes, a Granger cause-and-effect regulatory network based on Granger causality was established, which includes all genes. The experiments were carried out on the simulated data of Escherichia coli and yeast. It is verified that the autoregressive model is suitable for the sequential gene expression data. Compared with the NIR algorithm, the construction algorithm based on Granger causality has a higher recognition rate in the experiments on the real gene expression data of Saccharomyces cerevisiae.
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:Q811.4;O212.1

【相似文献】

相关期刊论文 前10条

1 张家军;蔡传政;王翼飞;;基因调控网络中的延滞动力学[J];应用科学学报;2007年01期

2 郭子龙;纪兆华;涂华伟;梁艳春;;基因调控网络的研究内容及其数据分析方法[J];电脑知识与技术;2008年15期

3 陈少白;罗嘉;;一类基因调控网络的定性分析[J];南京信息工程大学学报(自然科学版);2010年05期

4 李庆伟;全俊龙;刘欣;;基因调控网络研究进展[J];辽宁师范大学学报(自然科学版);2013年01期

5 叶纬明;吕彬彬;赵琛;狄增如;;少节点基因调控网络的控制[J];物理学报;2013年01期

6 王沛;吕金虎;;基因调控网络的控制:机遇与挑战[J];自动化学报;2013年12期

7 易东,李辉智;基因调控网络研究与数学模型的建立[J];中国现代医学杂志;2003年24期

8 雷耀山,史定华,王翼飞;基因调控网络的生物信息学研究[J];自然杂志;2004年01期

9 姜伟;李霞;郭政;李传星;王丽虹;饶绍奇;;时间延迟基因调控网络重构的决策树方法研究[J];中国科学(C辑:生命科学);2005年06期

10 张晗,宋满根,陈国强,骆建华;一种改进的多元回归估计基因调控网络的方法[J];上海交通大学学报;2005年02期

相关会议论文 前3条

1 熊江辉;李莹辉;;基因芯片数据分析的新方法与基因调控网络推理[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上)[C];2003年

2 王亚丽;周彤;;大规模基因调控网络因果关系的辨识[A];第二十九届中国控制会议论文集[C];2010年

3 冯晶;许勇;李娟娟;;非高斯噪声激励下基因调控网络的研究[A];第十四届全国非线性振动暨第十一届全国非线性动力学和运动稳定性学术会议摘要集与会议议程[C];2013年

相关重要报纸文章 前1条

1 吴佳s,

本文编号:1570189


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/1570189.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e76ad***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com