高通量测序误差模型分析及解码方案设计

发布时间:2017-07-31 17:21

  本文关键词:高通量测序误差模型分析及解码方案设计


  更多相关文章: 高通量测序 荧光光谱串扰 相位偏移 两核苷酸同时测序 解码


【摘要】:高通量DNA测序技术是目前生命科学领域的一种重要的研究手段。经过十几年的发展,高通量测序技术无论在测序通量还是测序速度上都有了很大的提升,测序成本也有了大幅度的降低。然而高通量测序错误率高等难题仍未得到有效解决。另外,目前市场上所有的商用测序仪器及其配套试剂都被国外测序仪公司所垄断,要打破这种局面必须发展具有自主知识产权的国产测序仪。本课题针对东南大学生物电子学国家重点实验室自主研制的AG系列测序仪,研究系统误差的来源及其纠错模型,以期提高现有AG-100测序平台数据产生的准确率,在此基础上,建立碱基识别算法并开发软件系统,并同时为双碱基编码测序技术的AG-200平台提供解码方案。本论文首先分析了高通量测序平台中常见的测序误差,介绍并比较了一些比较流行的误差模型及校正的工具。在此基础上,对自主研发的基于连接法测序的AG-100高通量测序平台,我们分析了该平台的误差来源,建立了相应的误差校正模型,主要包括荧光光谱串扰校正和相位偏移校正。对于光谱串扰,我们将其视作一个线性转换问题,建立相应的数学模型,明确了求解串扰矩阵是校正流程中的关键步骤。我们采取了逐步迭代的方法对串扰矩阵进行估算,并在迭代的过程中对荧光强度数据进行不断地校正。在相位偏移的校正步骤中,我们将测序片段按照连接法测序时的顺序分割成更小的片段,对分割后的片段分别建立相位偏移矩阵,然后逐一校正,再将其合成。最后我们为AG-100平台的碱基识别流程开发了软件,该软件接收荧光强度数据作为输入,输出fastq格式的包含序列和及其质量的文件。通过模拟试验证明该软件能有效地校正光谱串扰偏差。为提高测序效率,在连接测序的基础上,我们实验室还提出了两核苷酸同时合成DNA测序方案。相比较单核苷酸测序,两核苷酸测序具有较高的精度,但同时也造成每一轮测序结果不直观,我们需要对其进行解码。为此我们提出了相应的解码方案,并采用模拟数据集进行了测试,取得了完全正确的解码结果。然后将这个方案推广到包含测序错误的情况下,我们详细分析了三组编码序列的全部误差模式,并分别为其可能出现的测序错误提出了相应的纠正方案。通过模拟数据集的测试,初步验证了该解码方案的正确性。
【关键词】:高通量测序 荧光光谱串扰 相位偏移 两核苷酸同时测序 解码
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:Q78
【目录】:
  • 摘要4-5
  • Abstract5-8
  • 第一章 绪论8-18
  • 1.1 引言8
  • 1.2 测序技术的诞生与“人类基因组计划”8-9
  • 1.3 高通量测序技术问世9-13
  • 1.3.1 高通量测序技术的诞生10-11
  • 1.3.2 第三代测序技术11
  • 1.3.3 各类测序技术间的比较11-13
  • 1.4 高通量测序技术的应用与千人基因组计划13-15
  • 1.4.1 全基因组测序13-14
  • 1.4.2 宏基因组测序14
  • 1.4.3 研究DNA和蛋白质的相互作用14
  • 1.4.4 “千人基因组计划”14-15
  • 1.5 高通量测序目前存在的问题15
  • 1.6 课题的研究的意义与内容15-16
  • 1.6.1 课题背景及意义15-16
  • 1.6.2 课题研究内容16
  • 1.7 论文章节安排16-17
  • 1.8 本章小结17-18
  • 第二章 高通量测序的偏差及现行解决方案18-24
  • 2.1 高通量测序的偏差分类18-22
  • 2.1.1 不完善的化学反应引入的偏差18-20
  • 2.1.2 采用光学检测而带来的偏差20-22
  • 2.2 现行的碱基识别工具22-23
  • 2.3 本章小结23-24
  • 第三章 AG-100测序平台的误差模型分析及碱基识别方案研究24-35
  • 3.1 引言24
  • 3.2 荧光光谱串扰的校正思想24-29
  • 3.2.1 串扰模型24-25
  • 3.2.2 串扰矩阵分析25-28
  • 3.2.3 串扰校正流程28-29
  • 3.3 相位偏移校正29-31
  • 3.3.1 基于连接法测序的相位偏移处理29-30
  • 3.3.2 相位偏移处理的基本过程30-31
  • 3.4 AGNGS碱基识别软件31-34
  • 3.5 本章小结34-35
  • 第四章 两核苷酸同时合成DNA测序的解码方案研究35-52
  • 4.1 引言35
  • 4.2 两核苷酸同时合成DNA测序技术35-40
  • 4.2.1 两核苷酸同时合成DNA测序原理35-36
  • 4.2.2 两核苷酸同时合成DNA测序技术特点分析36-40
  • 4.2.3 解码方案相关术语40
  • 4.3 基于两组编码序列信息的解码方案40-42
  • 4.4 基于三组编码序列信息的解码方案的初步研究42-50
  • 4.4.1 无测序错误下基于三组编码序列信息的解码方案42-43
  • 4.4.2 存在测序错误下基于三组编码序列信息的解码方案43-50
  • 4.5 本章小结50-52
  • 第五章 总结与展望52-54
  • 5.1 工作总结52-53
  • 5.2 展望53-54
  • 参考文献54-58
  • 附录A AGNGS软件说明58-60
  • 附录B 解码测序、454、Illumina三大平台每序列平均拍照次数模拟试验60-62
  • 致谢62-63
  • 作者简介63

【相似文献】

中国期刊全文数据库 前10条

1 刘清萍,刘中华,唐新科,陈平,梁宋平;串联质谱在多肽测序中的应用[J];生命科学研究;2004年02期

2 张文力;;高通量测序数据分析现状与挑战[J];集成技术;2012年03期

3 李黎;;一种简化的质粒DNA快速测序法[J];国外医学(分子生物学分册);1991年03期

4 卢春,陈溥言,,蔡宝祥,王俊;一种纯化双链DNA测序模板的有效方法[J];生物技术;1996年04期

5 童大跃,伍新尧,蔡贵庆,李建金,刘秋玲;线粒体DNA高变区hν1快速测序方法及应用[J];生物技术通讯;2003年04期

6 许艳,卫红飞,胡小平,包木胜,王爱丽,程岩,王丽颖;DNA自动测序中的常见影响因素及测序反应体系的优化[J];吉林大学学报(医学版);2004年06期

7 刘力,庄志雄,陈雯,杨杏芬,凌文华,魏青,邓丽霞;应用连接介导PCR法于线粒体DNA的测序[J];中国职业医学;2000年03期

8 肖翠英,张思,仲武辉,夏庆杰;DNA自动测序中几种影响因素的研究[J];中华医学遗传学杂志;1998年04期

9 甄志成,姚志建;毛细管阵列电泳与规模化DNA测序[J];色谱;2001年04期

10 余才林;大规模DNA测序进展[J];国外医学.遗传学分册;1996年02期

中国重要会议论文全文数据库 前2条

1 陆祖宏;吕华;肖鹏峰;白云飞;葛芹月;周东蕊;;基于生物芯片的高通量低成本DNA快速测序及其在系统生物学研究中的应用[A];2007年全国生化与生物技术药物学术年会论文集[C];2007年

2 顾洁梅;柯耀华;岳华;刘玉娟;张增;张浩;胡伟伟;汪纯;何进卫;胡云秋;李淼;傅文贞;章振林;;全外显子组测序法鉴定一个导致不典型IBMPFD综合征的新的VCP基因突变[A];中华医学会第十一次全国内分泌学学术会议论文汇编[C];2012年

中国博士学位论文全文数据库 前6条

1 王春宇;生物高通量测序片段拼接与分子标记识别算法研究[D];哈尔滨工业大学;2015年

2 卢戌;基于第二代测序的转录组组装软件比较研究[D];兰州大学;2013年

3 安小平;利用高通量测序筛查未知病毒的相关技术研究[D];中国人民解放军军事医学科学院;2014年

4 吕鸣;人类基因组复杂序列区域的扩增与测序策略研究[D];上海交通大学;2009年

5 赵琛;基于高通量RNA测序的大鼠转录组注释研究[D];华东师范大学;2013年

6 杨松;慢性乙型肝炎患者阿德福韦酯耐药的检测与分析[D];山东大学;2009年

中国硕士学位论文全文数据库 前10条

1 裴金瑞;靶向捕获二代测序检测不明原因智力障碍/发育迟缓结果分析[D];山西医科大学;2015年

2 欧佳佳;杨树干旱响应转录组测序分析[D];南京林业大学;2015年

3 朱忠旭;基于表型测序的功能基因识别[D];浙江大学;2015年

4 姚刘慧;桑树转录组测序及SSR标记的开发与鉴定[D];江苏科技大学;2015年

5 夏忠奎;基于454与Ion Torrent平台的16S rRNA测序数据的比较分析与研究[D];电子科技大学;2014年

6 张森浩;秋眠及非秋眠紫花苜蓿转录组测序及秋眠相关差异基因的筛选[D];河南农业大学;2013年

7 李巧玲;双重测序法结合芯片捕获检测低频突变的方法的建立[D];华南理工大学;2015年

8 穆淑媛;烟草转录组测序及NtTTG2调控ARF同源基因表达的研究[D];南京农业大学;2014年

9 闫q

本文编号:600261


资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/600261.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e6e99***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com