基于DNase高通测序信息的DNA蛋白结合位点识别研究
发布时间:2021-04-17 11:42
自人类全基因组计划以来,对转录因子以及其结合位点的研究成为人类探索生命本质的重要课题。转录因子只有在与特定的结合位点结合之后才具有调控基因表达的功能。所以,准确识别出转录因子结合位点的位置成为遗传学的核心内容之一。2010年,Crawford提出的DNase-seq技术可以实现单次实验即可检测出全基因组范围内的蛋白结合位点。DNase-seq技术相比于目前广泛使用的ChIP-seq技术、ATAC-seq,表现出了诸多的优势,在提高检测效率和检测精度的同时,大幅降低了检测成本。在本课题研究中,首先在网站上获取到DNase-seq数据以及转录因子的有关数据。然后,利用FIMO工具得到确切的转录因子结合位点,提取整理每个结合位点的DNase-seq数据并构建数据集。随后,根据DNase-seq数据特点选择并构建了基于自动编码器神经网络的转录因子结合位点识别模型。接着,从转录因子结合位点的典型性和测序深度两个方面对所构建模型的识别结果进行分析,从而确定使用该识别模型所需的条件。最后,考虑到数据集的大小存在着不平衡的因素,我们选用指标灵敏度、特异性以及马修相关系数等指标来对所构建模型的识别能力进...
【文章来源】:哈尔滨工程大学黑龙江省 211工程院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
ChIP-seq技术流程图
图 2.1 ChIP-seq 技术流程图目前,基于 ChIP-seq 技术的转录因子结合位点的分析方法已相当成熟到了广泛应用[39],并且也得到了很多专家学者的支持。本质上讲,该心是寻找富集区域—即与转录因子结合的 DNA 序列,受到一定的保护作异性抗体免疫共沉淀之后,会被富集。当我们对大量的序列进行叠加就个类似驼峰的区域,我们把该富集区域称为“peak”区。如下图 2.2 所
哈尔滨工程大学硕士学位论文定一种转录因子的结合位点序列。检测效率低是 ChIP-seq 致命缺陷,直接导致了该技术浪费时间与人力资源[41]。而 DNase-seq 的发明很好地弥补了 ChIP-se技术的缺陷,为转录因子结合位点的研究节省了大量成本的同时也获得了更多的研究数据。2.3 ATAC-seq 技术ATAC-seq 技术是染色质开放区域定位技术与高通量测序技术的结合。也可以用来研究转录因子结合位点。该方法测序流程简单,并且对细胞数量的要求较低,从 500 到 50000 个细胞均可完成测序。该方法的主要原理是利用活性 Tn转座酶,体外与 DNA 测序接头结合,然后将 Tn5 转座酶作用于待测序列,由于转座酶的“转移”特性,会将携带的测序接头插入到待测序列中,在染色质的开放区域内,经接头的分割作用,待测序列即可被分割成 DNA 小片段,然后构建文库,PCR 扩增,即可完成测序。ATAC-seq 技术流程图如下图 2.3 所示。
【参考文献】:
期刊论文
[1]谷歌TensorFlow机器学习框架及应用[J]. 章敏敏,徐和平,王晓洁,周梦昀,洪淑月. 微型机与应用. 2017(10)
[2]ENCODE计划和功能基因组研究[J]. 丁楠,渠鸿竹,方向东. 遗传. 2014(03)
[3]用ID-SVM预测蛋白质的ATP结合位点[J]. 包文荣,赵巨东. 生物信息学. 2013(03)
[4]植物MYB蛋白与其靶定DNA结合位点之间的相互作用[J]. 李曼,赵芊,刘方,李浩,宋水山. 生物学杂志. 2013(04)
[5]利用ChIP-seq技术研究转录因子EDAG在全基因组的结合谱[J]. 董小明,郑巍薇,尹荣华,詹轶群,杨晓明,李长燕. 中国生物化学与分子生物学报. 2013(06)
[6]下一代测序中ChIP-seq数据的处理与分析[J]. 高山,张宁,李勃,徐硕,叶彦波,阮吉寿. 遗传. 2012(06)
[7]高通量测序技术及其应用[J]. 王兴春,杨致荣,王敏,李玮,李生才. 中国生物工程杂志. 2012(01)
[8]一种新的快速鉴定蛋白与靶DNA结合位点的方法[J]. 朱明,魏伟,陈明,张宪省,徐兆师,李连城,马有志. 作物学报. 2011(12)
[9]ChIP技术及其在基因组水平上分析DNA与蛋白质相互作用[J]. 李敏俐,王薇,陆祖宏. 遗传. 2010(03)
[10]基因芯片与高通量DNA测序技术前景分析[J]. 滕晓坤,肖华胜. 中国科学(C辑:生命科学). 2008(10)
博士论文
[1]基于机器学习的蛋白质结合位点特征化和预测方法研究[D]. 熊毅.武汉大学 2011
[2]miRNA及转录因子结合位点预测与调控功能分析[D]. 汪国华.哈尔滨工业大学 2009
[3]转录因子结合位点预测算法的研究与应用[D]. 徐东.上海大学 2005
硕士论文
[1]基于ChIP-seq数据的转录因子结合位点识别算法[D]. 贾瑶丽.北京交通大学 2016
[2]分类器性能评价研究[D]. 武婷婷.北京交通大学 2010
[3]蛋白质-DNA结构模型比较及其在转录因子结合位点预测中的应用[D]. 陈凌.复旦大学 2010
本文编号:3143393
【文章来源】:哈尔滨工程大学黑龙江省 211工程院校
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
ChIP-seq技术流程图
图 2.1 ChIP-seq 技术流程图目前,基于 ChIP-seq 技术的转录因子结合位点的分析方法已相当成熟到了广泛应用[39],并且也得到了很多专家学者的支持。本质上讲,该心是寻找富集区域—即与转录因子结合的 DNA 序列,受到一定的保护作异性抗体免疫共沉淀之后,会被富集。当我们对大量的序列进行叠加就个类似驼峰的区域,我们把该富集区域称为“peak”区。如下图 2.2 所
哈尔滨工程大学硕士学位论文定一种转录因子的结合位点序列。检测效率低是 ChIP-seq 致命缺陷,直接导致了该技术浪费时间与人力资源[41]。而 DNase-seq 的发明很好地弥补了 ChIP-se技术的缺陷,为转录因子结合位点的研究节省了大量成本的同时也获得了更多的研究数据。2.3 ATAC-seq 技术ATAC-seq 技术是染色质开放区域定位技术与高通量测序技术的结合。也可以用来研究转录因子结合位点。该方法测序流程简单,并且对细胞数量的要求较低,从 500 到 50000 个细胞均可完成测序。该方法的主要原理是利用活性 Tn转座酶,体外与 DNA 测序接头结合,然后将 Tn5 转座酶作用于待测序列,由于转座酶的“转移”特性,会将携带的测序接头插入到待测序列中,在染色质的开放区域内,经接头的分割作用,待测序列即可被分割成 DNA 小片段,然后构建文库,PCR 扩增,即可完成测序。ATAC-seq 技术流程图如下图 2.3 所示。
【参考文献】:
期刊论文
[1]谷歌TensorFlow机器学习框架及应用[J]. 章敏敏,徐和平,王晓洁,周梦昀,洪淑月. 微型机与应用. 2017(10)
[2]ENCODE计划和功能基因组研究[J]. 丁楠,渠鸿竹,方向东. 遗传. 2014(03)
[3]用ID-SVM预测蛋白质的ATP结合位点[J]. 包文荣,赵巨东. 生物信息学. 2013(03)
[4]植物MYB蛋白与其靶定DNA结合位点之间的相互作用[J]. 李曼,赵芊,刘方,李浩,宋水山. 生物学杂志. 2013(04)
[5]利用ChIP-seq技术研究转录因子EDAG在全基因组的结合谱[J]. 董小明,郑巍薇,尹荣华,詹轶群,杨晓明,李长燕. 中国生物化学与分子生物学报. 2013(06)
[6]下一代测序中ChIP-seq数据的处理与分析[J]. 高山,张宁,李勃,徐硕,叶彦波,阮吉寿. 遗传. 2012(06)
[7]高通量测序技术及其应用[J]. 王兴春,杨致荣,王敏,李玮,李生才. 中国生物工程杂志. 2012(01)
[8]一种新的快速鉴定蛋白与靶DNA结合位点的方法[J]. 朱明,魏伟,陈明,张宪省,徐兆师,李连城,马有志. 作物学报. 2011(12)
[9]ChIP技术及其在基因组水平上分析DNA与蛋白质相互作用[J]. 李敏俐,王薇,陆祖宏. 遗传. 2010(03)
[10]基因芯片与高通量DNA测序技术前景分析[J]. 滕晓坤,肖华胜. 中国科学(C辑:生命科学). 2008(10)
博士论文
[1]基于机器学习的蛋白质结合位点特征化和预测方法研究[D]. 熊毅.武汉大学 2011
[2]miRNA及转录因子结合位点预测与调控功能分析[D]. 汪国华.哈尔滨工业大学 2009
[3]转录因子结合位点预测算法的研究与应用[D]. 徐东.上海大学 2005
硕士论文
[1]基于ChIP-seq数据的转录因子结合位点识别算法[D]. 贾瑶丽.北京交通大学 2016
[2]分类器性能评价研究[D]. 武婷婷.北京交通大学 2010
[3]蛋白质-DNA结构模型比较及其在转录因子结合位点预测中的应用[D]. 陈凌.复旦大学 2010
本文编号:3143393
本文链接:https://www.wllwen.com/yixuelunwen/swyx/3143393.html