当前位置:主页 > 医学论文 > 西医药论文 >

中国结核分枝杆菌EAI和CAS基因型菌株全基因组测序分析

发布时间:2018-05-01 12:38

  本文选题:结核分枝杆菌 + EAI基因型 ; 参考:《中国疾病预防控制中心》2012年硕士论文


【摘要】:目的对中国结核分枝杆菌EAI和CAS基因型临床分离菌株(CCDC06029和CCDC06153)全基因组进行测序,并与其它已经完成全基因组测序的结核分枝杆菌复合群菌株的数据进行比对分析,了解EAI和CAS基因型菌株的全基因组分子特征,为进一步深入研究,如微进化、毒力学等,提供基础。方法选取经细菌学、药物敏感性和分子分型鉴定的中国结核分枝杆菌EAI和CAS基因型临床分离菌株各1株,2株菌均对四种一线抗结核药物敏感。应用改良罗氏培养基培养,收集菌体,采用CTAB法提取全基因组DNA;用Roche 454 GS FLX测序仪进行全基因组高通量测序,测序结果使用DNA序列拼装软件进行初始序列拼装,得到测序重叠群(contigs),人工手动与参考序列进行blast比对后,确定各个测序重叠群位置关系和首尾连接方式并预测测序未覆盖区(gap区)的大小Gap区和测序低值区域,经特异性PCR扩增后,使用ABI 3730测序仪进行测序。基因组全长序列使用Phred、Phrap和Consed软件包进行拼装和碱基修正,最终得到CCDC06029和CCDC06153两株菌的全基因组序列数据,与其他从NCBI genome网站下载的结核分枝杆菌复合群菌株的全基因组数据,在全基因组水平进行比对、分析。结果测序得到中国结核分枝杆菌EAI和CAS基因型菌株CCDC06029(?)CCDC06153的全基因组完整序列,大小分别为4406422 bp和4411683 bp,其基因组测序数据的准确度分别为99.9992%和99.9995%,预测的蛋白质编码序列(predicted protein coding sequences, CDSs)分别为4118个和4175个,CDSs平均大小分别为944bp和941bp。通过与已完成全基因组测序的结核分枝杆菌复合群菌株的全基因组数据的比对分析发现了存在于中国结核分枝杆菌EAI和CAS基因型中的多种分子特征。EAI基因型测序菌株CCDC06029异于结核分枝杆菌H37Rv的SNP位点共有2967个,其中位于蛋白编码区的SNP有2650个;Indel数目为430个。CAS基因型测序菌株CCDC06153异于结核分枝杆菌H37Rv的SNP位点共有2213个,其中位于蛋白编码区的SNP有1802个;Indel数目为374个。在此次研究中发现1011个EAI基因型特异性SNP,其中852个SNP位于蛋白编码区内;发现723个CAS基因型特异性SNP,其中547个位于蛋白编码区内。EAI基因型菌株CCDC06029与结核分枝杆菌标准菌株H37Rv比对分析后,共发现39个可能与毒力基因相关的SNP位置,其中非同义突变有20个,同义突变有19个。CAS基因型菌株CCDC06153与结核分枝杆菌标准菌株H37Rv比对分析后,共发现28个可能与毒力基因相关的SNP位置,其中非同义突变有13个,同义突变有15个。结论成功完成了中国结核分枝杆菌EAI和CAS基因型菌株的全基因组测序,为进一步研究EAI和CAS基因型菌株的基因结构特征、致病机制、分子进化等提供了全基因组序列数据。全基因组数据的初步分析发现EAI和CAS基因型菌株基因组序列中存在某些特异性的Indel、SNP及其它分子生物学特征,将对EAI和CAS基因型的快速鉴定、溯源等多个方面的研究提供良好基础,并将促进对结核分枝杆菌生物学本质的认识,对于有效防治结核病具有重要意义。
[Abstract]:Objective to sequence the whole genome of Mycobacterium tuberculosis EAI and CAS genotype clinical isolates (CCDC06029 and CCDC06153), and to compare and analyze the data of other Mycobacterium tuberculosis complex strains which have completed the whole genome sequencing, and to understand the whole genomic characteristics of the EAI and CAS genotypes, so as to further deepen the study of the genome of the strains of EAI and CAS. Studies, such as microevolution, toxic mechanics, etc., provide the basis. Methods 1 strains of Mycobacterium tuberculosis EAI and CAS genotypes were selected by bacteriology, drug sensitivity and molecular typing, and 2 strains were sensitive to four kinds of first-line anti tuberculosis drugs. The improved Roche culture medium was used to collect the mycelium and the whole base was extracted by CTAB method. The whole genome high throughput sequencing was carried out with the Roche 454 GS FLX sequencer. The sequencing results were sequenced using the DNA sequence assembly software for the initial sequence assembly, and the sequencing overlap group (contigs) was obtained. After the manual manual and the reference sequence was compared to the sequence, the location relationship and the first and the tail connection mode of the sequencing overlaps were determined and the sequencing was predicted. The size Gap area of the cover area (gap area) and the sequence of low value regions were amplified by specific PCR and were sequenced using ABI 3730 sequencer. The whole genome sequence used Phred, Phrap and Consed software packages to assemble and modify the base. Finally, the whole genome sequence data of the two strains of CCDC06029 and CCDC06153 were obtained, and the other from the NCBI genome web site. The whole genome data of the Mycobacterium tuberculosis complex strains were compared and analyzed at the whole genome level. The whole genome sequence of EAI and CAS genotype CCDC06029 (?) CCDC06153 of Mycobacterium tuberculosis in China was sequenced, the size of the genome was 4406422 BP and 4411683 BP respectively. The accuracy of the genome sequencing data was respectively For 99.9992% and 99.9995%, the predicted protein coding sequences (predicted protein coding sequences, CDSs) were 4118 and 4175 respectively. The average CDSs size of 944bp and 941bp., respectively, was found in Chinese tuberculosis through comparison and analysis of all genome data of the genome of Mycobacterium tuberculosis with complete genome sequencing. A variety of molecular characteristics in the EAI and CAS genotypes of Mycobacterium tuberculosis,.EAI genotypes, CCDC06029 are different from SNP loci of Mycobacterium tuberculosis H37Rv, of which there are 2650 SNP in the protein coding region; Indel number is 430.CAS genotype sequencing strains, CCDC06153 is different from the H37Rv SNP loci of Mycobacterium tuberculosis. There were 1802 SNP in the protein coding region and 374 in the Indel number. In this study, 1011 EAI genotype specific SNP were found, of which 852 SNP were located in the protein coding region; 723 CAS genotype specific SNP were found, and 547 of the.EAI genotype strains were located in the protein coding region, CCDC06029 and the standard Mycobacterium tuberculosis After H37Rv comparison, 39 SNP locations associated with virulence genes were found, of which there were 20 non synonymous mutations, and 19.CAS genotype strains, CCDC06153, and standard strains of Mycobacterium tuberculosis were compared and analyzed by the synonymous mutation, and a total of 28 possible locations of virulence genes were found, including 13 non synonymous mutations, and synonyms. There are 15 mutations. Conclusion the whole genome sequence of EAI and CAS genotypes of Mycobacterium tuberculosis in China has been successfully completed. The whole genome sequence data are provided for further research on the gene structure characteristics of EAI and CAS genotype strains, the pathogenesis mechanism and the molecular evolution. The preliminary analysis of the whole genome data has found the EAI and CAS genotypes. The existence of certain specific Indel, SNP and other molecular biological characteristics in the sequence of the group will provide a good basis for the rapid identification of EAI and CAS genotypes, traceability and so on, and will promote the understanding of the biological nature of Mycobacterium tuberculosis, which is of great significance for the effective prevention and treatment of tuberculosis.

【学位授予单位】:中国疾病预防控制中心
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:R378.911

【相似文献】

相关期刊论文 前10条

1 刘维达,吴绍熙,郭宁如;念球菌表型与基因型鉴定的比较[J];疾病控制杂志;1997年01期

2 张菁超;;乙型肝炎病毒基因型与表型的相关性研究[J];中国医学创新;2013年30期

3 欧强,谭德明,周明欢;不同HBV基因型HBV感染者的自身免疫现象[J];世界华人消化杂志;2004年06期

4 彭忠田,谭德明,刘映霞;不同基因型慢性乙型肝炎病毒感染者的自身免疫现象[J];南华大学学报(医学版);2005年02期

5 镡颖,汪旭,王晓燕,梁子卿;云南籍正常人群和肺癌人群GSTM1基因型多态性的比较研究[J];云南师范大学学报(自然科学版);2002年04期

6 陈恕凤;严卫丽;黄建凤;顾东风;;PGC-1α基因变异与中国北方汉族人群的血脂水平关联[J];中国分子心脏病学杂志;2009年02期

7 马英;窦晓光;李智伟;黄芬;乔光彦;闻颖;张明香;于蛟;赵贺群;;沈阳地区乙型肝炎病毒基因型分子流行病学研究[J];中华实验和临床病毒学杂志;2006年04期

8 ;西班牙不同危险人群HCV的基因型[J];疾病监测;1998年02期

9 袁建林,薛丽,白玉杰,赵锦荣,杨芳,武国军,王禾,张运涛,张波,李欣;高分辨率HLA-DRB基因型分析方法的研究[J];中华泌尿外科杂志;2005年11期

10 白红莲;严海明;杨光;;佛山地区乙型肝炎病毒基因型特点分析[J];现代医药卫生;2011年22期

相关会议论文 前2条

1 齐国辉;徐继忠;张玉星;王国英;;梨S基因PCR扩增体系的优化[A];全国第四届梨科研、生产与产业化学术研讨会论文集[C];2005年

2 刘霞;李喜宏;;水稻贮藏特性与籼粳基因型的关系[A];中国植物生理学会第十次会员代表大会暨全国学术年会论文摘要汇编[C];2009年

相关博士学位论文 前10条

1 姜存仓;不同基因型棉花对钾的反应差异及其机理研究[D];华中农业大学;2006年

2 邱慧珍;不同磷效率基因型小麦对苗期供磷状况的响应及其机理的研究[D];甘肃农业大学;2003年

3 曾爱中;乙肝病毒基因型与应答反应关系及逆转录酶和全基因组变异位点分析[D];重庆医科大学;2008年

4 郭再华;耐低磷水稻筛选、分类及其生理机制研究[D];华中农业大学;2005年

5 赵强;基于高通量测序的水稻基因型鉴定以及水稻籼粳第四号染色体比较基因组研究[D];上海交通大学;2011年

6 戢林;氮高效利用基因型水稻(Oryza sativa)氮素吸收分配特性研究[D];四川农业大学;2013年

7 黄月华;乙肝病毒基因型和病毒变异与肝细胞癌的关系研究[D];南方医科大学;2007年

8 赵耀;HBV同时分型和定量新方法的建立及基因型对药物敏感性的研究[D];重庆医科大学;2011年

9 罗远婵;农田中洋葱伯克氏菌基因型及其与医院同类致病菌的比较研究[D];浙江大学;2006年

10 秦艳丽;B基因型与C基因型乙型肝炎病毒部分生物学特性的比较[D];复旦大学;2010年

相关硕士学位论文 前10条

1 徐非凡;梨自交不亲和S基因型的鉴定[D];南京农业大学;2013年

2 白云;中国结核分枝杆菌EAI和CAS基因型菌株全基因组测序分析[D];中国疾病预防控制中心;2012年

3 史慧琴;水稻叶色敏感基因型筛选及其对氮素响应的生理机制[D];河南农业大学;2010年

4 庄学山;PEMT基因-774G/C多态性与非酒精性脂肪性肝病关系的研究[D];福建医科大学;2009年

5 辜青青;利用PCR-RFLP技术鉴定部分沙梨(Pyrus Pyrifolia Nakai)品种S基因型[D];华中农业大学;2006年

6 罗皓;广西HIV-1重组流行株基因变异的研究和快速基因分型方法的建立[D];广西医科大学;2005年

7 徐朴;冠心病与白细胞介素-1家族基因型的相关性研究[D];武汉大学;2004年

8 孙艳萍;选择基因型作图方法在数量性状基因定位中的有效性研究[D];中国农业科学院;2010年

9 尚晓丽;小麦及其近缘物种脂肪酸氧化酶和puroindoline b-2基因型鉴定和分子特征研究[D];河南农业大学;2012年

10 邱林;两种基因型蛔虫在小鼠体内的移行和分布[D];南昌大学;2007年



本文编号:1829419

资料下载
论文发表

本文链接:https://www.wllwen.com/xiyixuelunwen/1829419.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a8551***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com