ChIP-Seq中DNA模体挖掘工具的比较
本文关键词:ChIP-Seq中DNA模体挖掘工具的比较,,由笔耕文化传播整理发布。
【摘要】:下一代测序技术,尤其是Ch IP-Seq技术的普及,产生了一系列大数据量、高复杂度的数据。而DNA模体的挖掘,是Ch IP-Seq数据功能分析的一个很重要的模块。目前,已有大量的软件能够从Peak-Calling的数据中寻找出模体。但是我们对于这些软件的信息所知甚少。直至目前为止还没有专注于转录因子的Ch IP-Seq数据的软件比较。因此本文挑选了6款软件MEME、DREME、CHIPMUNK、RSAT-peak motif、HOMER和SIOMICS。使用了4个物种Mus musculus、Homo sapiens、Drosophila melanogaster、Saccharomyces cerevisiae的37套真实数据对这六款软件进行了运行时间、模体数目、模体长度分布的测试;4个物种Homo sapiens、Mus musculus、Drosophila melanogaster、Caenorhabditis Elegans的模拟数据对软件的准确度进行测试。通过本文的测试,我们发现这几款软件在Saccharomyces cerevisiae的数据中表现均比较好,准确度均大于30%,其中最高的为MEME,达到了66.7%。而在Homo sapiens、Mus musculus、Drosophila melanogaster这三个物种的数据中,HOMER相较于其它软件有较高的准确度,大约在30%左右。同时我们认为软件结果之间的相互覆盖度并不能成为取代准确度的判定指标。
【关键词】:下一代测序 ChIP-Seq 转录因子结合位点 模体
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:Q811.4;TP311.13
【目录】:
- 中文摘要4-5
- Abstract5-7
- 第一章 前言7-12
- 1.1 基因序列测序技术的发展7-8
- 1.2 ChIP-chip与ChIP-Seq技术的发展和比较8-10
- 1.3 本课题研究的目的以及意义10
- 1.4 本文的研究内容10-12
- 第二章 国内DNA模体数据库及基于ChIP-Seq数据挖掘工具的发展现状12-18
- 2.1 综合性软件:MEMESUIT、RSAT peak-模体、HOMER12-13
- 2.2 单一性性软件:ChIPMunk、SIOMICS13
- 2.3 DNA模体数据库的广泛度的汇总13-18
- 第三章DNA模体挖掘软件比较18-22
- 3.1 特征比较18-20
- 3.2 算法比较20-22
- 第四章 数据处理流程22-38
- 4.1 虚拟数据收集及设计22-24
- 4.2 虚拟数据预处理24-28
- 4.3 实际数据收集28-32
- 4.4 实际数据集预处理32-33
- 4.5 模体挖掘数据处理33-38
- 第五章 结论及展望38-46
- 5.1 软件运行时间统计38-40
- 5.2 挖掘出的模体特征统计40-42
- 5.3 软件准确度和灵敏度测评42-46
- 参考文献46-49
- 附录一49-53
- 附录二53-62
- 附录三62-75
- 攻读硕士学位期间公开发表的论文75-76
- 致谢76-77
【相似文献】
中国期刊全文数据库 前10条
1 王春连;胡秀珍;;用二次判别方法识别蛋白质β-发夹模体[J];生物物理学报;2009年04期
2 李慧敏;胡俊;张静;;果蝇核糖体蛋白基因中潜在转录协同作用模体的统计分析[J];云南大学学报(自然科学版);2010年03期
3 胡秀珍;李前忠;;矩阵打分的方法应用于蛋白质β-发夹模体的识别[J];内蒙古大学学报(自然科学版);2007年06期
4 姜雪;胡秀珍;;打分矩阵方法在β-发夹模体识别中的应用[J];生物信息学;2008年04期
5 岳俊杰;谭明峰;周围;王夏;李北平;王月兰;梁龙;;细菌黏附素序列模体分析[J];生物技术通讯;2008年05期
6 姜雪;;蛋白质βαβ模体序列的统计分析及其识别[J];昆明理工大学学报(理工版);2010年05期
7 贾少春;胡秀珍;;基于添加功能位点信息的组合向量预测β-发夹模体[J];内蒙古工业大学学报(自然科学版);2012年03期
8 陈丹;梁振霞;李慧敏;;组合调控中过表达模体对距离的统计检验[J];基因组学与应用生物学;2013年01期
9 宋航宇;胡秀珍;冯振兴;姜卓;孙利霞;;基于统计特征的酶蛋白质中特殊模体βαβ的预测[J];生物物理学报;2013年09期
10 叶玉珍,解涛,丁达夫;蛋白质功能基团三维模体及其应用[J];科学通报;2000年12期
中国重要会议论文全文数据库 前4条
1 李彩艳;胡秀珍;;蛋白质中两种Strand-Loop-Strand模体的判断[A];第十次中国生物物理学术大会论文摘要集[C];2006年
2 高燕莉;张镭;李剑颖;;应用64排CT优化高分辨CT扫描方案的模体研究[A];中华医学会第十三届全国放射学大会论文汇编(下册)[C];2006年
3 李兴东;万国庆;田中青;;X射线CT检测标准的研究[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(下册)[C];2002年
4 安晶刚;;PET质量检测的方法及相应模体[A];全国医用辐射防护与安全学术研讨会论文汇编[C];2004年
中国博士学位论文全文数据库 前7条
1 刘丙强;原核生物中的转录调控模体预测研究[D];山东大学;2010年
2 刘倩;基于贝叶斯统计的基因非编码区与模体识别问题研究[D];西安电子科技大学;2014年
3 周川;原核生物调控模体和调节子预测算法研究[D];山东大学;2014年
4 周鹏;生物非键模体[D];浙江大学;2011年
5 张凌慧;基因组中顺式调控模体的特征分析与计算预测[D];中国协和医科大学;2005年
6 刘立芳;生物信息学中的多序列比对与模体识别问题研究[D];西安电子科技大学;2006年
7 张懿璞;转录因子结合位点识别问题的算法研究[D];西安电子科技大学;2014年
中国硕士学位论文全文数据库 前10条
1 周燕;SRK-ARC1识别模体序列多态性与甘蓝亲和指数的相关性研究[D];西南大学;2015年
2 马平;基因组序列8-mer模体使用分离与不同序列组成和物种进化的关系[D];内蒙古大学;2015年
3 刘国君;酵母基因组8-mer模体使用的进化分离与功能分析[D];内蒙古大学;2015年
4 王晶;ChIP-Seq中DNA模体挖掘工具的比较[D];苏州大学;2015年
5 赵振华;模体发现问题的若干算法及应用研究[D];西安电子科技大学;2009年
6 万春娟;基于聚类和团求精的模体识别算法[D];西安电子科技大学;2012年
7 孙玲;基于约束的方法查找细胞周期网络的骨干模体[D];西安电子科技大学;2011年
8 张瀚元;基因转录调控模体预测的研究及其在线服务开发[D];吉林大学;2015年
9 侯青敏;基于子图密度的序列模体发现算法研究[D];西安电子科技大学;2009年
10 詹海萍;弱信号模体检测的图搜索算法[D];西安电子科技大学;2010年
本文关键词:ChIP-Seq中DNA模体挖掘工具的比较,由笔耕文化传播整理发布。
本文编号:370844
本文链接:https://www.wllwen.com/yixuelunwen/swyx/370844.html