耐药菌全基因组测序数据的质量控制可视化
发布时间:2021-10-22 21:40
耐药菌的大量存在和传播,日益威胁公众健康和卫生安全,给临床、实验室检测和监测细菌耐药性方面的工作带来严峻挑战,亟需对病原菌进行快速的药物敏感性测试和细菌耐药机理分析。单细胞全基因组测序在发现新的耐药基因上有着快速免培养、可揭示异质性等优势,但是由于单细胞测序数据易污染、测序偏好性大,需要对单细胞测序数据进行全面的质量控制和深层次分析。目前,针对耐药菌基因组数据分析的工具和集成化系统有待完善,其分析方法也需改进。本文一方面进行耐药菌测序数据的全面质量控制。首先,收集公开数据并进行基本分析,发现公开系统中数据来源较单一,选取部分数据作为基因注释的对比参考。然后,对高通量处理结果进行一系列的可视化分析设计,对单核苷酸多态性、基因组污染进行统计分析与可视化;使用t-SNE算法对序列所属科系类别进行可视化,发现B3样本中含大量肠杆菌科、棒杆菌科细菌和棒状杆菌等信息。最后,选取单个、多个样本的基因组序列数据分别进行了潜在类别分析和潜在类别回归分析,分析耐药菌的基因序列特点,有助于耐药菌性能的基因分析。另一方面构建集成化、可视化的分析系统。使用R的shiny技术构建了单细胞全基因组测序数据统计分析可...
【文章来源】:曲阜师范大学山东省
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
高通量测序数据分析流程图
第三章全基因组数据可视化分析15第三章全基因组数据可视化分析3.1数据背景目前,国内外对大肠杆菌的左氧氟沙星耐受性研究少,由前面分析发现条件致病性大肠杆菌对养殖业和公共卫生安全都造成极大威胁,本文对大肠杆菌的左氧氟沙星耐受性进行研究,选取单细胞中心实验室的基因检测数据和生物信息数据库(NCBI、NIAID、PATRIC)中已公布的基因组数据库。由国家过敏与感染疾病研究所和疾病预防控制中心等相关机构提供资助共同构建的病原体系统资源整合中心(PATRIC)是一个全球化的细菌生物信息学资源中心。PATRIC可以提供所有细菌的生物信息学分析,特别是病原体的分析,用户可以访问250000多个带有注释元数据的统一注释和公开的基因组。PATRIC致力于开发基因组数据分析算法,整合生物信息大数据资源,发展基于基因组数据分析的生物信息分析流程,提升基因组数据生物信息分析效率和能力。截止到2020年初,PATRIC系统中已经整合公开的不同类型大肠杆菌基因组数据共9556例,其中全基因组数据共8544例,如图3.1,占总数的90%以上;其中宿主来源是人类的数据占总数据量的一半。图3.1基因组状态占比统计图PATRIC中有关大肠杆菌的基因组样本统计情况如下图,基因组样本来自世界众多国家的实验数据。通过统计图表(图3.2)可见,数据库中美国的数据占比为一半以上,其次是中国、法国等国家。从地区分布地图(图3.3)可以看出,数据库中的数据来源分布全国各地,在亚欧大陆国家分布密集。
第三章全基因组数据可视化分析16图3.2PATRIC样本来源国家数量饼图图3.3PATRIC样本来源国家分布地图系统数据库中的数据尚不完整和充足,由于不同国家地区的不同实验者的统计方法有差异,缺失值较多且时效性不强。除公开数据外,本文还采用一批测试数据(由中国科学院青岛生物能源与过程研究所单细胞中心提供),是尿路感染病原菌的耐药性鉴定和单细胞基因组测序数据的初步分析结果。3.2单核苷酸多态性统计与可视化单核苷酸多态性(SNP)是指在基因组水平上发生的单个核苷酸的变异引起的DNA序列多态。单核苷酸多态性统计与可视化有助于检测样品的单核苷酸变体并对其进行基因分型。本次分析取4个样本集,分别标记为A9、A10、B3、B9。为解决等位基因缺失,假阳性错误和覆盖范围不均的问题,使用专门用于单细胞数据的Monovar技术[13]检测样品的单核苷酸变体并对其进行基因分型,得到结果为VCF格式文
【参考文献】:
期刊论文
[1]基于潜在类别的公路旅客群体细分模型[J]. 戢晓峰,李德林. 公路交通科技. 2019(10)
[2]医学生睡眠问题的潜类别及其影响因素分析[J]. 周军,金来润,陶梦君,丁书姝,袁慧. 赤峰学院学报(自然科学版). 2019(07)
[3]全基因组测序与生物信息学分析在细菌耐药性研究中的应用[J]. 沈应博,史晓敏,沈建忠,汪洋,王少林. 生物工程学报. 2019(04)
[4]肠杆菌科细菌的分布与耐药性的分析[J]. 苏晓曼,张义,李慧玲. 黑龙江医药科学. 2018(04)
[5]细菌耐药性检测技术方法及其应用[J]. 车洁,陈霞,李娟,卢金星. 疾病监测. 2017(09)
[6]由H7N9引发的对人兽共患病的思考[J]. 张湘安,代茂,杨丽莎. 湖南畜牧兽医. 2013(04)
[7]病原微生物快速检测方法及研究进展[J]. 李维彬,郭辰虹,王玉炯. 生物技术通报. 2006(02)
硕士论文
[1]一种单细胞测序数据流程化分析方法[D]. 张博洋.哈尔滨工业大学 2019
[2]基于单细胞测序数据的细胞分化轨迹算法探究[D]. 苏晓曼.哈尔滨工业大学 2019
[3]基于高通量测序数据的人兽共患病病原检测分析平台的研究与构建[D]. 李家宽.军事科学院 2018
[4]Pannonibacter phragmitetus 31801的基因组测序和生物信息学分析[D]. 周亚军.华侨大学 2017
[5]基于乳腺癌基因组数据的分析与可视化平台实现[D]. 邹杰民.湖南大学 2017
[6]几种临床常见致病菌的全基因组序列测定及分析[D]. 刘丰.北京协和医学院 2016
[7]基于高通量测序的微生物基因组学研究[D]. 黄勇.中国人民解放军军事医学科学院 2013
本文编号:3451882
【文章来源】:曲阜师范大学山东省
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
高通量测序数据分析流程图
第三章全基因组数据可视化分析15第三章全基因组数据可视化分析3.1数据背景目前,国内外对大肠杆菌的左氧氟沙星耐受性研究少,由前面分析发现条件致病性大肠杆菌对养殖业和公共卫生安全都造成极大威胁,本文对大肠杆菌的左氧氟沙星耐受性进行研究,选取单细胞中心实验室的基因检测数据和生物信息数据库(NCBI、NIAID、PATRIC)中已公布的基因组数据库。由国家过敏与感染疾病研究所和疾病预防控制中心等相关机构提供资助共同构建的病原体系统资源整合中心(PATRIC)是一个全球化的细菌生物信息学资源中心。PATRIC可以提供所有细菌的生物信息学分析,特别是病原体的分析,用户可以访问250000多个带有注释元数据的统一注释和公开的基因组。PATRIC致力于开发基因组数据分析算法,整合生物信息大数据资源,发展基于基因组数据分析的生物信息分析流程,提升基因组数据生物信息分析效率和能力。截止到2020年初,PATRIC系统中已经整合公开的不同类型大肠杆菌基因组数据共9556例,其中全基因组数据共8544例,如图3.1,占总数的90%以上;其中宿主来源是人类的数据占总数据量的一半。图3.1基因组状态占比统计图PATRIC中有关大肠杆菌的基因组样本统计情况如下图,基因组样本来自世界众多国家的实验数据。通过统计图表(图3.2)可见,数据库中美国的数据占比为一半以上,其次是中国、法国等国家。从地区分布地图(图3.3)可以看出,数据库中的数据来源分布全国各地,在亚欧大陆国家分布密集。
第三章全基因组数据可视化分析16图3.2PATRIC样本来源国家数量饼图图3.3PATRIC样本来源国家分布地图系统数据库中的数据尚不完整和充足,由于不同国家地区的不同实验者的统计方法有差异,缺失值较多且时效性不强。除公开数据外,本文还采用一批测试数据(由中国科学院青岛生物能源与过程研究所单细胞中心提供),是尿路感染病原菌的耐药性鉴定和单细胞基因组测序数据的初步分析结果。3.2单核苷酸多态性统计与可视化单核苷酸多态性(SNP)是指在基因组水平上发生的单个核苷酸的变异引起的DNA序列多态。单核苷酸多态性统计与可视化有助于检测样品的单核苷酸变体并对其进行基因分型。本次分析取4个样本集,分别标记为A9、A10、B3、B9。为解决等位基因缺失,假阳性错误和覆盖范围不均的问题,使用专门用于单细胞数据的Monovar技术[13]检测样品的单核苷酸变体并对其进行基因分型,得到结果为VCF格式文
【参考文献】:
期刊论文
[1]基于潜在类别的公路旅客群体细分模型[J]. 戢晓峰,李德林. 公路交通科技. 2019(10)
[2]医学生睡眠问题的潜类别及其影响因素分析[J]. 周军,金来润,陶梦君,丁书姝,袁慧. 赤峰学院学报(自然科学版). 2019(07)
[3]全基因组测序与生物信息学分析在细菌耐药性研究中的应用[J]. 沈应博,史晓敏,沈建忠,汪洋,王少林. 生物工程学报. 2019(04)
[4]肠杆菌科细菌的分布与耐药性的分析[J]. 苏晓曼,张义,李慧玲. 黑龙江医药科学. 2018(04)
[5]细菌耐药性检测技术方法及其应用[J]. 车洁,陈霞,李娟,卢金星. 疾病监测. 2017(09)
[6]由H7N9引发的对人兽共患病的思考[J]. 张湘安,代茂,杨丽莎. 湖南畜牧兽医. 2013(04)
[7]病原微生物快速检测方法及研究进展[J]. 李维彬,郭辰虹,王玉炯. 生物技术通报. 2006(02)
硕士论文
[1]一种单细胞测序数据流程化分析方法[D]. 张博洋.哈尔滨工业大学 2019
[2]基于单细胞测序数据的细胞分化轨迹算法探究[D]. 苏晓曼.哈尔滨工业大学 2019
[3]基于高通量测序数据的人兽共患病病原检测分析平台的研究与构建[D]. 李家宽.军事科学院 2018
[4]Pannonibacter phragmitetus 31801的基因组测序和生物信息学分析[D]. 周亚军.华侨大学 2017
[5]基于乳腺癌基因组数据的分析与可视化平台实现[D]. 邹杰民.湖南大学 2017
[6]几种临床常见致病菌的全基因组序列测定及分析[D]. 刘丰.北京协和医学院 2016
[7]基于高通量测序的微生物基因组学研究[D]. 黄勇.中国人民解放军军事医学科学院 2013
本文编号:3451882
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3451882.html