当前位置:主页 > 医学论文 > 肿瘤论文 >

循环肿瘤DNA测序的数据分析方法

发布时间:2021-07-28 07:47
  液体活检是近些年来发展起来的新技术,该技术能够直接通过血液、尿液或其他体液样本对疾病,特别是癌症进行检测。由于样本取自于身体的循环系统,相比组织样本可以获得更加全面的疾病信息,因此可以较好地克服肿瘤异质性问题。液体活检的对象主要包括循环肿瘤细胞、外泌体以及循环肿瘤核酸(主要是循环肿瘤DNA)。因为循环肿瘤DNA取材方便,提取方法成熟可靠,可直接进行DNA建库并进行高通量测序,所以成了目前这三者当中研究最多的对象,在临床中也得到了更多应用。然而,虽然循环肿瘤DNA的实验技术较为成熟,但是其数据分析方法却较为困难,其原因在于肿瘤患者血液中循环的DNA片段只有极少部分来自肿瘤,其它大部分来自于身体其他正常细胞或者白细胞,这导致循环肿瘤DNA在所有细胞外循环DNA中所占的比例非常低,绝大多数会低于2%,有的甚至可以低于千分之一,使得敏感地检测这些突变并非易事。另一方面,样本的实验处理和高通量测序带来的错误会对数据产生很大影响,使得测序的结果数据中产生大量假阳性突变,而真实的突变很容易就淹没在这样的高背景噪声当中。所以,需要开发更好的数据分析方法,去除或降低循环肿瘤DNA测序中的系统噪声,同时提... 

【文章来源】:中国科学院大学(中国科学院深圳先进技术研究院)广东省

【文章页数】:124 页

【学位级别】:博士

【文章目录】:
致谢
摘要
Abstract
第一章 液体活检
    1.1 液体活检概述
        1.1.1 CTC循环肿瘤细胞
        1.1.2 Exosome外泌体
        1.1.3 ctDNA循环肿瘤DNA
    1.2 液体活检的应用
        1.2.1 个性化用药指导
        1.2.2 癌症监测和耐药预测
        1.2.3 癌症的辅助诊断和筛查
第二章 循环肿瘤DNA的高通量测序技术
    2.1 ctDNA高通量测序的实验方法
        2.1.1 捕获的设计
    2.2 ctDNA高通量测序数据的生物信息学分析
第三章 FastQ数据的自动化过滤、剪裁、错误校正以及质量控制
    3.1 背景
        3.1.1 数据质控
        3.1.2 数据剪裁
        3.1.3 接头去除
        3.1.4 自动过滤
        3.1.5 本软件的其他创新
    3.2 方法
        3.2.1 汽泡的检测和可视化
        3.2.2 自动化剪裁
        3.2.3 read过滤
        3.2.4 overlap分析和错误校正
        3.2.5 测序错误的分析
        3.2.6 自动化去除接头污染
        3.2.7 数据质量分析
        3.2.8 软件的实现
    3.3 结果和讨论
    3.4 结论
第四章 MutScan:目标变异的快速检测和可视化
    4.1 核心的技术问题
    4.2 方法
        4.2.1 定长levenstein automata
        4.2.2 基于Rolling Hash的seq2int
        4.2.3 Bloom Filter
        4.2.4 局部搜索匹配定位
    4.3 软件实现
        4.3.1 read pair的merge
        4.3.2 可视化方法
    4.4 结果评估
        4.4.1 敏感度评估
        4.4.2 性能评估
    4.5 讨论
        4.5.1 MutScan进行肿瘤耐药分析
    4.6 结论
第五章 FusionDirect / GeneFuse:高效检测基因融合
    5.1 背景
    5.2 FusionDirect核心算法
        5.2.1 建立索引
        5.2.2 read扫描
        5.2.3 生成融合位点
    5.3 FusionDirect软件实现
        5.3.1 Julia语言
        5.3.2 OpenGene.jl
        5.3.3 FusionDirect的程序实现
    5.4 FusionDirect结果
        5.4.1 FusionDirect讨论
    5.5 GeneFuse
        5.5.1 GeneFuse算法和工作流程
        5.5.2 GeneFuse的可视化结果
        5.5.3 GeneFuse的讨论
第六章 SeqMaker: 可模拟ctDNA测序数据的NGS仿真器
    6.1 背景
    6.2 方法
        6.2.1 采样过程以及CNV仿真
        6.2.2 SNV仿真
        6.2.3 基因融合仿真
        6.2.4 测序错误仿真
        6.2.5 扩增偏好性模拟
        6.2.6 接头的仿真
        6.2.7 分子条形码(UMI)的仿真
        6.2.8 质量的仿真
        6.2.9 软件的实现
    6.3 结论
第七章 cell-free DNA的断裂模式和模式识别
    7.1 背景
    7.2 方法
        7.2.1 特征选择
        7.2.2 模型训练和验证
    7.3 结论
第八章 结束语
    8.1 论文总结
        8.1.1 在FASTQ数据预处理中,对PE数据进行overlap分析
        8.1.2 从原始FASTQ检测变异的方法
        8.1.3 自动化的adapter剪切
        8.1.4 基因融合的检测和可视化
    8.2 未来的工作方向
        8.2.1 结合人工智能与基因健康数据的深度挖掘
        8.2.2 更准确的ctDNA捕获测序拷贝数分析方法
        8.2.3 更好的基线分析技术和过滤方法
        8.2.4 更准确的ctDNA变异检测软件
        8.2.5 ctDNA肿瘤突变负荷(TMB)分析
        8.2.6 ctDNA中微卫星不稳定性(MSI)的分析
        8.2.7 大样本数据挖掘和可视化分析
    8.3 展望
参考文献
作者简介


【参考文献】:
期刊论文
[1]Circulating micro RNAs and long non-coding RNAs in gastric cancer diagnosis:An update and review[J]. Ya-Kai Huang,Jian-Chun Yu.  World Journal of Gastroenterology. 2015(34)



本文编号:3307530

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/zlx/3307530.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0b7af***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com