嵌合体序列识别与热点选择偏好研究及其在单倍型分析中的应用探究
本文关键词:嵌合体序列识别与热点选择偏好研究及其在单倍型分析中的应用探究
更多相关文章: 新一代测序 多重置换扩增 phi29 DNA聚合酶 嵌合序列 嵌合热点 偏好选择 单倍型组装
【摘要】:近年来,基于多重置换扩增(MDA)的全基因组扩增技术(WGA)因为phi29DNA聚合酶的高扩增效率、高保真、等温扩增等特性而被广泛应用,但是多重置换扩增过程中会生成一定数量的嵌合序列。本研究结合前人对嵌合序列的研究,设计并建立了一套简便高效的基于BWA比对软件的嵌合序列识别流程,并实现了对所识别的嵌合序列进行分类、数值比例分析的功能;同时,本研究设计流程对人类参考基因组序列进行扫描,寻找易于产生嵌合序列的嵌合热点区域,并探究嵌合序列对嵌合热点的选择偏好。又因为嵌合序列的两部分来自同一个模板,且两部分之间的嵌合间距可达5000nt以上,这使得探究嵌合序列用于单倍型的组装成为可能。本研究获得的研究结果主要包括:(1)基于BWA开发了一套全新的嵌合序列识别分析流程,可以直接从测序数据的比对结果中识别嵌合序列,实现嵌合序列的分类和数量统计。在同一批MDA测序数据中,新流程相较于已有的基于SOAP2开发的嵌合序列分析流程,具有识别的嵌合序列类别更清晰,更高效和耗时更短等特点。(2)基于嵌合序列特有的片段间具有重合片段这一特征和片段间的序列距离分布特征,对基因组中嵌合序列的潜在产生区域的特征进行描述,设计并建立嵌合热点区域的扫描流程,在人类参考基因组序列上寻找易形成嵌合序列的嵌合热点区域,并对扫描得到的嵌合热点进行信息挖掘,结果表明具有不同长度重合片段的嵌合热点在人类参考基因组中均呈现随机分布,嵌合热点的数量与染色体的长度呈线性关系。(3)通过对MDA中实际产生的嵌合序列和人类参考基因组的嵌合热点的联合分析发现,嵌合序列对染色体没有选择偏好,嵌合序列中两片段间距在80-280nt呈现峰值,通过综合嵌合序列在重合片段长度和重合片段GC含量上的选择偏好发现,嵌合序列更易在重合片段的退火温度与MDA的反应温度相近的嵌合热点产生。这一结果有助于优化MDA反应体系,减少嵌合序列的产生。
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q811.4
【相似文献】
中国期刊全文数据库 前1条
1 林小春;;中国科学家领衔“破译”绵羊基因组[J];科技致富向导;2014年17期
中国重要报纸全文数据库 前2条
1 记者 白毅;人类肠道微生物最高质量参考基因集数据库问世[N];中国医药报;2014年
2 记者 马芳;人类首获自身参考基因组数据集合[N];南方日报;2010年
中国博士学位论文全文数据库 前4条
1 SAMMINA MAHMOOD;[D];华中农业大学;2016年
2 易会广;无参考基因组的比较基因组学研究[D];复旦大学;2013年
3 陈庚;整合多层次数据多方位解析和注释人类转录组[D];华东师范大学;2014年
4 Daoura Gaoh Goudia Bachir;普通小麦(Triticum aestivum L.)及谷子(Setaria italica L.)C_4光合途径关键酶基因的表达模式分析[D];西北农林科技大学;2017年
中国硕士学位论文全文数据库 前5条
1 张雪莹;小麦近等基因系白粉病抗性反应的转录组分析[D];山东农业大学;2015年
2 吴欣欣;‘复瓣跳枝’梅花瓣呈色相关蛋白质组与转录组分析[D];南京农业大学;2014年
3 谭云涛;运用RAD(Restriction Site Associated DNA)技术构建烟草高密度连锁图谱[D];昆明理工大学;2016年
4 张义军;参考基因压缩库间快速迁移算法研究[D];深圳大学;2017年
5 鲁娜;嵌合体序列识别与热点选择偏好研究及其在单倍型分析中的应用探究[D];东南大学;2017年
,本文编号:1281736
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1281736.html