当前位置:主页 > 医学论文 > 传染病论文 >

大数据挖掘基于血液标本的结核病诊断新标识分子及临床验证

发布时间:2020-07-19 00:32
【摘要】:结核病(Tuberculosis,TB)是结核分枝杆菌(Mycobacterium tuberculosis,MTB,以下简称结核菌)引起的传染病,全球约三分之一的人被结核菌潜伏感染。每年约900万新增结核病患者,导致约150万人死亡,结核病严重威胁人类健康。中国是结核病高负担国家,结核病是我国的重点防治对象。早发现,早治疗是防控结核病的关键所在。结核病的诊断主要依靠传统的MTB抗酸染色法和MTB培养技术。但前者的灵敏度较差,后者耗时较长,不能满足如今对结核病快速诊断的需求。免疫学诊断,分子诊断以及影像学诊断方法方便快捷,但对结核病诊断的敏感性有待提高。尽管在结核病的诊断和治疗方面取得了巨大的进步,但及时、精确的诊断结核病仍然存在诸多困难。为了达到消灭结核病的目的,我们需要对结核病有更深层次的认识。数据科学,信息技术和生物技术的交叉融合,大数据的产生,给我们提供了一个对抗结核病的新途径。我们能从更宏观和更微观的角度来了解结核病的致病机理、MTB与人类基因的相互关系和耐药MTB的产生,开辟新的结核病诊断和治疗方法。面对结核病防治工作的难题,世界卫生组织提出新的理想的结核病诊断方法应使用易收集的非痰样本(如血液,尿液),诊断方法对儿童和细菌共感染者敏感性高,且可用于疗效监测。血液样本易收集,易定量,基于血液样本的结核病分子诊断方法有望满足其要求,但目前缺少相关诊断标志物的研究。测序技术飞速发展,测序成本降低,芯片技术不断普及,基因表达谱数据量增长迅猛。公共数据库如美国国立卫生研究院(National Institutes of Health,NIH)的基因表达数据库(Gene Expression Omnibus,GEO)中存储有大量人感染结核分枝杆菌的基因表达谱数据。这些数据尚未被完全利用,背后蕴含丰富的价值有待进一步挖掘,是寻找结核病诊断标志分子的一条新的途径。本研究检索NIH GEO数据库,从中筛选出6个含有结核病人外周血单核细胞基因表达谱数据集,用于挖掘结核病诊断标识基因。其中GSE19491作为发现数据集,GSE40553,GSE56153,GSE42834,GSE39941和GSE37250作为验证数据集。首先,利用R语言对GSE19491的原始数据进行预处理,计算差异表达基因,构建WGCNA共表达网络,分析基因表达变化趋势,通过比较分析得到与结核病相关的63个基因,功能富集分析发现它们与人免疫应答有关;然后对这63个基因进一步筛选,利用结核病人和健康人的血液样本进行RT-PCR验证,最终确定4个在结核病人与健康人血液中的差异表达的基因,它们分别是:UBE2L6(Ubiquitin/ISG15-conjugating enzyme E2 L6),BATF2(Basic leucine zipper transcriptional factor ATF-like),SERPING1(Plasma protease C1 inhibitor)和VAMP5(Vesicle-associated membrane protein 5),分别与泛素化、免疫细胞分化、补体活化和囊泡运输有关;最后,利用受试者工作特征曲线(receiver operating characteristic curve,ROC)对这4个基因在包含不同条件的共约1000个样本的5个独立数据集中进行可靠性验证,平均AUC=0.86,特异性81%,敏感性86%,四个基因的表达量还随着治疗进程显著降低。BATF2,UBE2L6,VAMP5和SERPING1是潜在的结核病诊断和治疗效果监测的标志物。本研究结果已经申报PCT专利(PCT/CN2019/080563,结核病标志物在结核病诊断和疗效评估中的运用)。
【学位授予单位】:西南大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R52
【图文】:

预处理,原始数据,值分布,样本


第 4 章 实验结果与分析第 4 章 实验结果与分析据预处理结果 数据库下载 GSE19491 原始数据,进行芯片预处理后,筛选表达探针,去除未注释探针,对于多个探针对应一个基因的达值作为基因最终表达值。最终,我们得到含有 19229 个基 156 个样本。GSE19491 经处理后,数据集中各样本基因表可用于后续分析(图 4-1)。

网络图,差异表达基因


19491 中 PTB - HC 和 PTB - LTB 的差异表达基因。(A)火山图展示 PTB -因情况,p < 0.05,且|log2FC| > 0.8 为差异基因;(B)PTB - HC 和 PTB - LTB 共有 117 个基因在 GSE19491 中的表达值绘制聚类热图。edifferentially expressed genes in PTB comparedwith HCandLTB in G ofdifferentially expressed genes at adjusted p <0.05 and |log2FC|>0.8 for PTB-HC and PTdifferentially expressed genes shared by PTB-HC and PTB-LTB. (C) Heatmap of thgene expression value in the GSE19491.A 共表达网络分析离群样本的去除491 包含 19229 个基因的表达情况,进行 WGCNA 分析前有因进行过滤,利用各个基因表达量的绝对中位差过滤,最终保构建共表达网络。A 的网络图符合无尺度网络特征,容易受异常样本影响,通过氏距离进行层次聚类,根据聚类树高度移除离群样本。在移除

频数分布,层次聚类,样本,无尺度


SE19491 样本层次聚类树。(A)移除离群样本前的层次聚类树;(B)移除离群样本4-3. Hierarchical clustering tree of GSE19491. The hierarchical clustering tree (A) beving the outlier sample.阈值筛选建加权基因共表达网络,将基因间相似矩阵转化为邻接矩阵时,依赖ft-thresholdingpower,以下用 β 表示)的选择。参数 β 能强化强相关的相关的基因,使网络符合无尺度网络特征,更具有生物学意义。如易发现关键基因,β 过高,用以形成模块的基因会很少。无尺度网络拓扑结构中,节点连接度频数分布满足 p(k) ~ k-y的q 代表在不同 β 下无尺度网络的拟合指数,即节点连接度频数的对点出现的概率的对数 log(p(k))之间的相关性。SFT.R.sq 可用来衡量网尺度网络模型,SFT.R.sq 越接近 1,说明越无尺度网络特征。我们计下网络的 SFT.R.sq,平均连接度(mean.k),中位数(median.k)和.k)。观察不同 β 下的 SFT.R.sq 和 mean.k 值(图 4-4),发现可选择 β

【相似文献】

相关期刊论文 前10条

1 张明霞;杨倩婷;;结核病诊断生物标志物的研究现状和展望[J];中国热带医学;2019年10期

2 阳仕雄;阳咏芳;付汉东;邢志芳;;结核病诊断技术方法的选择及实验室诊断路径[J];国际检验医学杂志;2017年19期

3 刘国远;;世卫组织呼吁投资改善结核病诊断方法[J];结核病健康教育;2006年02期

4 宋文虎;;结核病诊断方法的敏感性、特异性和预测值[J];中国防痨通讯;1987年04期

5 王开敏;曹青山;楚云平;高凤兰;阎伯强;范菊梅;赵晶平;高炳田;;醛化鞣酸化羊红细胞电泳对结核病诊断的研究[J];新乡医学院学报;1987年04期

6 何昭阳;副结核病诊断综述[J];吉林农业大学学报;1988年01期

7 孙增璞,童荪,吴建鸿,方明娟;HRP-SPA ELISA在结核病诊断上的应用[J];上海免疫学杂志;1988年04期

8 唐神结,邓伟吾;结核病诊断的若干进展[J];国外医学.呼吸系统分册;1989年03期

9 杨连生;李惠兰;;酶联免疫吸附试验在结核病诊断方面的近况[J];山西医药杂志;1989年02期

10 侯林浦;高东哲;马淑萍;;快速ELISA法检测血清抗体用于结核病诊断的研究[J];中国公共卫生学报;1989年01期

相关会议论文 前10条

1 张广宇;;结核病诊断难题的思考[A];全国第6届中西医结合传染病学术会议论文汇编[C];2015年

2 张广宇;;结核病诊断和治疗若干问题的思考[A];结核病诊治新进展学术研讨会资料汇编[C];2014年

3 王麟生;王志辉;;农村结核病诊断、治疗与管理93例分析(摘要)[A];中华医学会第六届全国结核病学术大会论文汇编[C];2000年

4 文霞;柳爱华;宝福凯;代旭磊;吕松群;赵勤;汪亚玲;;γ-干扰素释放试验应用于结核病诊断的研究进展[A];第四届中国临床微生物学大会暨微生物学与免疫学论坛论文汇编[C];2013年

5 陈效友;;结核病诊断新技术的应用评价[A];结核病诊治新进展学术研讨会资料汇编[C];2014年

6 段巧艳;梁红萍;;γ-干扰素释放试验在结核病诊断中应用价值探讨[A];纪念中国微生物学会临床微生物学专业委员会成立五周年-第五届中国临床微生物学大会暨台湾海峡两岸微生物学与免疫学论坛论文汇编[C];2014年

7 王u&民;;《结核病诊断实验室检验规程》修改的意义[A];2006中国防痨协会全国学会会议论文集[C];2006年

8 张广宇;;肺病介入学技术在胸部结核病诊断和治疗应用进展[A];2010年中国防痨协会临床/基础专业学术大会汇编[C];2010年

9 杨永建;;结明试验在结核病诊断中的作用[A];中国防痨协会全国学术会议大会学术报告[C];2001年

10 高保护;鲁宏武;王树应;;结明试验在结核病诊断中的价值[A];中国防痨协会全国学术会议大会学术报告[C];2001年

相关重要报纸文章 前10条

1 记者 龙九尊;结核病诊断最快只需6小时[N];中国科学报;2012年

2 记者 赵宏 通讯员 李义 曹惠俊;结核病诊断研究取得重大突破[N];西安日报;2000年

3 颜优华;我省结核病诊断技术达国际先进水平[N];湖南日报;2011年

4 记者 卞晨光;世卫呼吁开发结核病诊断新方法[N];科技日报;2006年

5 本报记者 黎宇文;结核病诊断市场迎机遇[N];中国证券报;2016年

6 李杰;结核病诊断蛋白芯片即将推广[N];健康报;2007年

7 本报记者 薛伟;莞产结核病诊断 新药明年上市[N];东莞日报;2012年

8 李杰;超越结核病诊断“金标准”的蛋白芯片将推广使用[N];科技日报;2007年

9 记者 刘国远;世卫组织呼吁投资改善结核病诊断方法[N];中国中医药报;2006年

10 本报记者 胡其峰;结核病诊断技术亟待改进[N];光明日报;2014年

相关博士学位论文 前3条

1 张泓泰;结核病诊断及耐药检测分子标识物的发现[D];中国科学院研究生院(近代物理研究所);2014年

2 王森;新型结核诊断抗原和生物标志物的筛选及其在结核病诊断中的应用[D];复旦大学;2012年

3 陈颖钰;结核病新型分子标识的筛选及其在诊断和疫苗中的应用[D];华中农业大学;2010年

相关硕士学位论文 前9条

1 古寅钟;大数据挖掘基于血液标本的结核病诊断新标识分子及临床验证[D];西南大学;2019年

2 张鹏;化学发光方法的建立及其应用于结核病诊断的研究[D];河南工业大学;2014年

3 高新桃;牛结核病诊断用细胞因子的筛选及其在临床检测中的初步应用[D];中国农业科学院;2014年

4 邓渊升;IFN-γ释放检测试验的结核病诊断价值研究现状[D];重庆医科大学;2013年

5 姜霞;r-干扰素释放反应在结核病诊断中的应用研究[D];昆明医学院;2009年

6 王伟;ESAT-6抗原诱发的γ-干扰素测定在结核病诊断中的应用[D];郑州大学;2010年

7 谢莉;体外γ干扰素检测在结核分枝杆菌潜伏感染及结核病诊断中的临床意义[D];北京市结核病胸部肿瘤研究所;2004年

8 冯鑫;结核分枝杆菌CFP10-ESAT6-PPE68融合蛋白的表达及其在结核病诊断中的初步应用[D];重庆医科大学;2013年

9 徐志弘;结核分枝杆菌Rv1273c和Rv1272c的功能研究及microRNA在结核病诊断中的应用研究[D];上海交通大学;2014年



本文编号:2761630

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/chuanranbingxuelunwen/2761630.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户12c73***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com