当前位置:主页 > 医学论文 > 生物医学论文 >

体细胞基因突变高通量测序检测生物信息学分析参考物质的研究

发布时间:2020-11-04 21:18
   目前,癌症已成为我国居民死亡的主要原因之一,是严重危害我国居民健康的重大公共卫生问题。近年来,随着个体化医疗的不断发展,根据肿瘤患者的基因突变信息为患者制定个性化治疗方案的“精准医学”模式在临床肿瘤患者的治疗当中发挥着日益重要的作用。大量的肿瘤基因突变在癌症患者的诊断、治疗及预后判断中的临床应用价值已被证实。由于越来越多的肿瘤基因突变位点不断被发现,传统的单个位点的基因检测方法已不能满足临床需求。高通量测序技术的出现,使得多个基因的多个位点同时检测成为可能。高通量测序较传统的分子检测方法要复杂得多,既包括核酸提取、序列靶向富集、文库制备和测序等含多个实验步骤的“湿实验”过程,还有包含测序后的数据质量分析、参考序列比对、变异识别、注释和结果报告解读等步骤的生物信息学分析流程(即“干实验”过程),生物信息学分析流程对于高通量测序检测结果的准确性与“湿实验”一样具有决定性意义。对于临床高通量测序检测的生物信息学分析,要想获得准确可靠的生物信息学分析结果,就需要选择合适的参考物质(Reference material,RM),也称为参考数据(Reference dataset)对生物信息学分析流程进行优化、性能确认、室内质量控制(Internal Quality Control,IQC)以及定期开展室间质量评价(External Quality Assessment,EQA)。通过使用临床样本或肿瘤细胞系DNA等制备的参考数据虽然可以用于生物信息学分析流程的优化、性能确认、室内质量控制及室间质量评价,但其制备较为繁琐,成本较高,且无法包含所有的突变类型。基于测序数据编辑的计算机模拟方法制备的生物信息分析参考数据,具有制备简单、快速、成本低且不受突变类型的限制等优点。但目前已有的基于测序数据编辑的生物信息学分析参考数据模拟软件BAMSurgeon仅能对单核苷酸变异及短片段插入/缺失变异有较好的模拟效果,而不能模拟拷贝数变异、多核苷酸变异等复杂变异,并且不能对靶向测序数据的大片段结构变异进行模拟。此外,BAMSurgeon也不能对Ion Torrent测序平台的数据进行模拟。因此,缺少合适的生物信息学分析参考数据对不同临床实验室的生物信息学分析流程进行全面的性能评估。本研究中,我们开发了一款基于测序数据编辑的生物信息学分析参考数据模拟软件——VarBen。为验证VarBen软件制备的体细胞突变生物信息学分析参考数据是否可以模拟真实肿瘤样本中的体细胞突变,我们将含有真实体细胞突变的肿瘤样本测序数据与VarBen和BAMSurgeon软件制备的体细胞突变生物信息学分析参考数据进行了比较。结果表明,相比于BAMSurgeon,VarBen模拟体细胞突变的检出效果与肿瘤样本测序数据中真实体细胞突变(MB gold set)的检出效果更加相近,这一结果证明VarBen制备的生物信息学分析参考数据可模拟出接近真实肿瘤样本测序数据的体细胞突变。同时为验证VarBen软件的可靠性和稳定性,我们评估了原始测序数据基因组背景、比对软件的使用以及测序reads分割是否会对VarBen产生影响。结果证明原始测序数据的基因组背景、使用的比对软件以及原始测序reads分割不会对VarBen软件体细胞突变的模拟产生影响。综上,我们的验证实验证明了 VarBen软件的可靠性和稳定性,且其制备的模拟测序数据可用作临床体细胞突变检测生物信息学分析参考数据。为全面评估临床实验室肿瘤体细胞突变生物信息分析能力,我们使用VarBen制备的生物信息学分析参考数据开展了肿瘤体细胞基因突变高通量测序检测生物信息学分析室间质量评价调研活动。我们共收到实验室提交的113个有效分析结果,实验室提交结果统计分析显示,相对于单核苷酸变异,目前临床实验室对短片段插入/缺失变异的生物信息学分析能力还有待提高,尤其是复杂插入-缺失变异和FLT基因内部串联重复(internal tandem duplication,ITD)。实验室在建立高通量测序基因突变检测生物信息学分析流程的过程中,需充分重视对生物信息学分析流程的性能确认,以保证分析结果的准确性。此外,本次室间质评也证明了 VarBen制备生物信息学分析参考数据的实用性。综上所述,本研究开发了一款基于测序数据编辑的生物信息学分析参考数据模拟软件—VarBen。与目前已有模拟软件相比,VarBen解决了目前无法对拷贝数变异、多核苷酸变异、复杂插入-缺失变异等复杂变异以及靶向测序数据的大片段结构变异进行模拟的难题,且同时适用于Illumina测序平台、华大BGI测序平台和Ion torrent测序平台。基于测序数据编辑的方法可保留高通量测序“湿实验”部分文库制备及上机测序过程中产生的背景错误分布模式,从而保证模拟数据更加的接近临床真实测序数据,同时可对任意类型的突变位点进行模拟,具有制备成本低、快速、可靠等优点。通过使用VarBen制备个性化的生物信息学分析参考数据可帮助临床实验室发现其生物信息学分析流程中存在的问题,从而帮助临床实验室提高基因突变检测的准确性。
【学位单位】:北京协和医学院
【学位级别】:博士
【学位年份】:2019
【中图分类】:Q811.4;R730.5
【部分图文】:

碱基序列,高通量,测序


“G”四个碱基的流动顺序即可计算出DNA的碱基序列信息。虽然各个平台??都有自己不同的测序原理,但其测序的基本流程比较相近,根据实验流程的不同,??高通量测序基因检测主要分为两个部分(图1):?1)实验操作部分,又称为“湿实验”??(wet-bench?part?of?NGS?);包括样本的米集、DNA的提取、加入分子标签(barcode?)、??目标区域靶向富集(基于PCR的扩增子靶向捕获技术或基于核酸杂交的探针捕获??技术)、测序文库制备、上机测序、测序数据的生成。2)生物信息学分析部分,该??过程又称为??干实验”(dry-bench?part?of?NGS);通过高性能的计算机和不同的生物??信息分析软件的组合建立生物信息分析流程(Bioinfomiatics?pipeline?),主要步骤包??括:原始数据质控、参考序列比对、变异识别、注释和临床报告解读等。??肿瘤组织标本?正常配对样本??????-1??■I?_??Sample?collection?and?processing?汽?i甬晕测序??r…—.'

流程图,样本模,肿瘤,流程


g.ow?caoumor?genome?smuaonyaren??根据目前国内外研究现状,测序数据编辑(Readsediting)策略是目前模拟临床??生物信息学分析流程参考数据的最佳方案。因此,我们选取了测序数据编辑策略并??确定了测序数据的编辑流程(图3):??1)首先将测序完成后的原始测序数据比对到参考基因组,获得比对后的测序??数据(BAM文件),经过参考基因组比对完成之后的每一条read可获得其??在参考基因组上的坐标信息。??2)提供一个需要模拟的突变列表,根据提供的突变列表信息将需要进行编辑??的reads挑选出来。突变列表包含的信息主要包括:突变位点的位置(染色??体起始和终止位点)、目标突变频率、突变类型以及突变的碱基。??3)根据突变列表提供的突变类型、突变频率以及突变的碱基类型对选取的??reads进行相应的编辑。??4)将编辑后的测序reads重新比对到参考基因组以获取编辑之后正确的比对信??息,随后与未编辑的原始测序reads进行合并,最终得到含有特定突变位点??的模拟肿瘤测序样本。??

结构变异,平衡易位,串联重复,倒位


Alt??sssssssssss???Alt.?■丨■—?^??串联重复?倒位??E?F??Ref.?ez¥- ̄??-.?mm???Ref.?mzm-???????Alt.??mrm ̄—??— ̄mzm???Alt.??mrm???一 ̄_:ji????平衡易位?非平衡易位??G??染色体全臂易位??图6结构变异的不同类型??Fig.?6?Different?types?of?structural?variants??A:大片段缺失;B:外源DNA插入;C:串联重复;D:倒位;E:平衡易位;??F:非平衡易位;G:染色体全臂易位??
【相似文献】

相关期刊论文 前10条

1 沈兴;潘博;周挥铭;刘玲娟;田杰;;mmu-miR-3475-3P在心脏发育中的生物信息学分析[J];重庆医学;2017年26期

2 李纪强;黄东兰;孙瑶;姜茂竹;麦仲伦;曾融;张积仁;郑燕芳;;2001—2010年结直肠癌易感基因的生物信息学分析[J];肿瘤防治研究;2013年11期

3 郭秀霞;程鹏;杨培培;王海防;刘丽娟;张崇星;王怀位;公茂庆;;淡色库蚊氨肽酶N基因的克隆及生物信息学分析[J];中国人兽共患病学报;2016年03期

4 姚元枝;黎晓英;魏麟;伍贤进;刘胜贵;唐玉莲;;鱼腥草乙酰辅酶A酰基转移酶基因克隆、表达及生物信息学分析[J];中草药;2015年01期

5 黄江;胡旭初;黄艳;余新炳;包怀恩;郎书源;廖兴江;;牛带绦虫亚洲亚种苹果酸脱氢酶基因的生物信息学分析[J];中国寄生虫学与寄生虫病杂志;2008年03期

6 成军;李克;陆荫英;王琳;刘妍;;丙型肝炎病毒核心蛋白结合蛋白6基因和蛋白的生物信息学分析[J];世界华人消化杂志;2003年04期

7 郭笑;陈冬雪;韩笑;魏景艳;孙晶波;徐广宇;盛瑜;安丽萍;;人谷胱甘肽过氧化物酶的生物信息学分析[J];北华大学学报(自然科学版);2016年06期

8 尹积荣;杨凯;白玉兴;王邦康;;甲状旁腺素的生物信息学分析[J];口腔医学研究;2011年07期

9 谢超;郜尽;袁运生;俞雁;;蛋白质相互作用及互作网络的生物信息学分析[J];上海交通大学学报(医学版);2009年04期

10 郭蓉;;沉默调节因子的生物信息学分析[J];黑龙江畜牧兽医;2017年09期


相关博士学位论文 前10条

1 李子阳;体细胞基因突变高通量测序检测生物信息学分析参考物质的研究[D];北京协和医学院;2019年

2 潘登;SCA3小鼠的脑电研究和生物信息学分析[D];郑州大学;2017年

3 杨波;高通量数据的生物信息学分析和一致性排序算法研究[D];武汉大学;2014年

4 IBUKUN AKINBAMBO AKINYEMI;[D];中国科学技术大学;2018年

5 张亮;重金属镉致肝癌的生物信息学分析及候选基因的功能验证[D];中国农业大学;2018年

6 马永平;含质粒人两歧双歧杆菌的分离、质粒测序和生物信息学分析[D];重庆医科大学;2005年

7 苏志熙;几种哺乳动物表达序列标签(EST)生物信息学分析[D];浙江大学;2006年

8 韦博;基于芯片数据和文本挖掘的胶质瘤生物信息学分析[D];吉林大学;2015年

9 上官辉;肝癌易感相关基因及组织基因表达谱生物信息学分析[D];南方医科大学;2015年

10 许波;倭蜂猴粪便微生物多样性研究及功能基因的生物信息学分析[D];云南师范大学;2015年


相关硕士学位论文 前10条

1 李鑫淳;向日葵锈菌金属蛋白酶基因的生物信息学分析及其原核表达[D];内蒙古农业大学;2019年

2 郝文俊;Netrin-1蛋白的结构与功能生物信息学分析[D];中国医科大学;2019年

3 叶烨;广西壮族地区孕妇AFB1内暴露与AFB1对人肝细胞的生物信息学分析[D];广西医科大学;2019年

4 陈嘉雯;基于E基因的非洲型寨卡病毒QPCR检测方法的建立及生物信息学分析[D];南方医科大学;2019年

5 潘磊;华细辛cad基因生物信息学分析与原核表达[D];上海交通大学;2017年

6 赖文杰;激素敏感与去势抵抗性前列腺癌的生物信息学分析[D];南方医科大学;2018年

7 方娜;早期青光眼相关基因的生物信息学分析[D];苏州大学;2018年

8 余毛毛;男性先天性低促性腺激素性性腺功能减退的基因诊断研究[D];江苏大学;2018年

9 高营;UNC5D蛋白的生物信息学分析[D];中国医科大学;2018年

10 赵霞;小麦抗病分子标记的生物信息学分析[D];山西大学;2018年



本文编号:2870621

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/swyx/2870621.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c486f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com