在细胞重编程过程中阶段特异性基因簇的预测研究
发布时间:2021-07-19 17:52
细胞重编程是在特定诱导条件下,将分化的成熟体细胞重编程为多能性甚至全能性细胞的过程。了解细胞重编程过程中不同阶段基因表达的特异性变化,对于阐明诱导性多能干细胞(induced pluripotent stem cells,iPSCs)的重编程机制、提高其诱导效率具有重要作用。目前的生物实验已通过对多能性转录因子的筛选、组合及过表达,成功将成熟体细胞诱导分化为iPSCs。但是,现有研究未见从转录因子的结合峰及组蛋白修饰等其它因素的角度筛选阶段特异性基因簇的研究。因此,本文基于转录因子的结合峰及结合组蛋白修饰等其他因素建立理论预测模型对重编程阶段特异性基因簇进行预测。本文的研究内容共包括三部分:(1)基于转录因子(transcription factor,TF)结合谱特征的阶段特异性基因簇的预测。(2)基于组蛋白修饰(histone modification,HMs)特征的阶段特异性基因簇的预测。(3)基于TF结合联合HMs特征的阶段特异性基因簇的预测。本文的ChIP-seq数据和微阵列转录组数据均来自Gene Expression Omnibus(GEO)数据库,登录号分别为GSE675...
【文章来源】:内蒙古大学内蒙古自治区 211工程院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
细胞重编程过程
在细胞重编程过程中阶段特异性基因簇的预测研究20图3.2Oct4-BP模型Figure3.2ThemodelofOct4-BP基于Oct4-BP方法的阶段特异性基因簇的分类预测模型的步骤为如下:步骤1.构造分类:在已有的研究基础上,进一步利用基因的差异表达分别对基因启动子,增强子区域构造阶段特异性基因簇:起始阶段、成熟阶段和稳定阶段。并将得到的结果作为类别标签;步骤2.提取特征:统计Oct4及RNApol在阶段特异性基因簇区域的结合peak总量,将其作为模型的前两个特征,第三个特征为标准化的基因表达值,后两个特征分别是Oct4和RNApol乘法交互项、基因表达值平方交互项;步骤3.初始化网络:根据阶段特异性基因簇的定义确定网络输入层节点数为5、隐含层节点数为3,输出层节点数为3,并初始化输入层、隐含层和输出层神经元之间的连接权值,初始化隐含层阈值,输出层阈值,给定学习速率0.0075和神经元激励函数sigmoid:步骤4.网络训练:取定迭代次数为10000,计算隐含层输出,输出层及误差,根据网络预测误差更新权值及阈值,迭代训练分类网络;步骤5.根据步骤4得到的模型参数,计算出分类方法的评价指标PRF值、Rocarea和准确率等,并对基因启动子和增强子区域的预测性能进行评估。3.5结果与分析通过统计分析和特征组合提取3个阶段特异性基因簇的启动子和增强子区域Oct4和RNApol的结合peak信息,获得5维特征向量,并由此构建了三个阶段特异性基因簇的分类预测模型Oct4-BP。基于Oct4-BP模型,我们得到了基因启动子和增强子区域的分类预测结
内蒙古大学硕士学位论文21果,如图3.3-3.4所示。由图3.3-3.4可以看出,对于Rocarea,增强子区域的分类结果比启动子区域的分类结果提升了4%。图3.3基于Oct4的阶段特异性基因簇的预测结果:启动子区域特征预测结果Figure3.3Predictionresultsofphase-specificgeneclustersbasedonOct4:predictionresultsinpromoterregioncharacteristics
【参考文献】:
期刊论文
[1]基于词向量语义分类的微博实体链接方法[J]. 冯冲,石戈,郭宇航,龚静,黄河燕. 自动化学报. 2016(06)
[2]染色质免疫共沉淀-测序(ChIP-Seq)技术及数据分析方法介绍[J]. 杨薇,刘若水. 河南科学. 2014(08)
[3]基于证据理论的多分类器中文微博观点句识别[J]. 郭云龙,潘玉斌,张泽宇,李莉. 计算机工程. 2014(04)
[4]SVM多类别分类方法在客户流失预测中的应用研究[J]. 李兴国,谢伟,卢光松. 计算机应用与软件. 2010(03)
硕士论文
[1]小鼠诱导性多潜能干细胞系的建立与鉴定[D]. 申红芬.中南大学 2009
[2]拟南芥一具亮氨酸拉链的转录因子的功能研究与表达分析[D]. 边金艳.山东师范大学 2008
本文编号:3291153
【文章来源】:内蒙古大学内蒙古自治区 211工程院校
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
细胞重编程过程
在细胞重编程过程中阶段特异性基因簇的预测研究20图3.2Oct4-BP模型Figure3.2ThemodelofOct4-BP基于Oct4-BP方法的阶段特异性基因簇的分类预测模型的步骤为如下:步骤1.构造分类:在已有的研究基础上,进一步利用基因的差异表达分别对基因启动子,增强子区域构造阶段特异性基因簇:起始阶段、成熟阶段和稳定阶段。并将得到的结果作为类别标签;步骤2.提取特征:统计Oct4及RNApol在阶段特异性基因簇区域的结合peak总量,将其作为模型的前两个特征,第三个特征为标准化的基因表达值,后两个特征分别是Oct4和RNApol乘法交互项、基因表达值平方交互项;步骤3.初始化网络:根据阶段特异性基因簇的定义确定网络输入层节点数为5、隐含层节点数为3,输出层节点数为3,并初始化输入层、隐含层和输出层神经元之间的连接权值,初始化隐含层阈值,输出层阈值,给定学习速率0.0075和神经元激励函数sigmoid:步骤4.网络训练:取定迭代次数为10000,计算隐含层输出,输出层及误差,根据网络预测误差更新权值及阈值,迭代训练分类网络;步骤5.根据步骤4得到的模型参数,计算出分类方法的评价指标PRF值、Rocarea和准确率等,并对基因启动子和增强子区域的预测性能进行评估。3.5结果与分析通过统计分析和特征组合提取3个阶段特异性基因簇的启动子和增强子区域Oct4和RNApol的结合peak信息,获得5维特征向量,并由此构建了三个阶段特异性基因簇的分类预测模型Oct4-BP。基于Oct4-BP模型,我们得到了基因启动子和增强子区域的分类预测结
内蒙古大学硕士学位论文21果,如图3.3-3.4所示。由图3.3-3.4可以看出,对于Rocarea,增强子区域的分类结果比启动子区域的分类结果提升了4%。图3.3基于Oct4的阶段特异性基因簇的预测结果:启动子区域特征预测结果Figure3.3Predictionresultsofphase-specificgeneclustersbasedonOct4:predictionresultsinpromoterregioncharacteristics
【参考文献】:
期刊论文
[1]基于词向量语义分类的微博实体链接方法[J]. 冯冲,石戈,郭宇航,龚静,黄河燕. 自动化学报. 2016(06)
[2]染色质免疫共沉淀-测序(ChIP-Seq)技术及数据分析方法介绍[J]. 杨薇,刘若水. 河南科学. 2014(08)
[3]基于证据理论的多分类器中文微博观点句识别[J]. 郭云龙,潘玉斌,张泽宇,李莉. 计算机工程. 2014(04)
[4]SVM多类别分类方法在客户流失预测中的应用研究[J]. 李兴国,谢伟,卢光松. 计算机应用与软件. 2010(03)
硕士论文
[1]小鼠诱导性多潜能干细胞系的建立与鉴定[D]. 申红芬.中南大学 2009
[2]拟南芥一具亮氨酸拉链的转录因子的功能研究与表达分析[D]. 边金艳.山东师范大学 2008
本文编号:3291153
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3291153.html