基于TCGA数据的肿瘤预后相关基因数据库的构建
发布时间:2023-01-28 08:38
背景:肿瘤是指组织细胞不受控制地异常增生而逐步形成的肿块,可以分为良性肿瘤和恶性肿瘤两大类。恶性肿瘤中起源于上皮组织的称为癌,起源于间叶组织的称为肉瘤。恶性肿瘤是危害人类健康的主要因素之一,2018年全年全球死于恶性肿瘤的人数接近1000万。肿瘤标志物是由肿瘤细胞产生的或者被肿瘤细胞影响的正常细胞产生的,具有表征肿瘤发生、预后的物质。材料与方法:用于筛选独立预后基因的肿瘤RNA-seq数据和对应肿瘤的临床数据下载自TCGA数据库旗下的GDC网站。对于没有临床正常样本的肿瘤,我们下载了GTEx数据库的正常样本进行了补充。大致方法如下:1,我们对RNA-seq数据进行了清洗,并将Ensemble名称转换成了基因名;2,通过差异分析,得到在肿瘤样本和正常样本中差异表达的基因;3.将得到的差异表达基因表达数据与生存数据合并分析,得到和生存相关的差异表达基因;4.将前两步筛选得到的基因表达数据与临床数据合并,做多因素COX分析,筛选可以作为独立预后因子的基因;5.对于可作为独立预后因子的基因,我们绘制1年生存率的接受者操作特性曲线(ROC曲线),并且计算曲线下面积AUC,筛选AUC>0.6的基因...
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 肿瘤的概述
1.2 常见恶性肿瘤
1.3 常见致癌因素
1.3.1 遗传因素
1.3.2 物理致癌因素
1.3.3 化学致癌因素
1.3.4 生物致癌因素
1.4 肿瘤预后生物标志物
1.5 TCGA数据库
1.6 本文结构
第二章 材料与方法
2.1 数据下载与整理
2.1.1 TCGA表达数据下载
2.1.2 TCGA临床数据下载
2.2 数据预处理
2.2.1 表达数据预处理
2.2.2 临床数据预处理
2.3 分析流程
2.3.1 筛选独立预后基因
2.4 本章小结
第三章 独立预后基因筛选与数据库的构建
3.1 膀胱尿路上皮癌
3.1.1 表达数据和临床数据
3.1.2 分析结果
3.2 肾透明细胞癌
3.2.1 表达数据和临床数据
3.2.2 分析结果
3.3 肾乳头状细胞癌
3.3.1 表达数据和临床数据
3.3.2 分析结果
3.4 胰腺癌
3.4.1 表达数据和临床数据
3.4.2 分析结果
3.5 结肠癌
3.5.1 表达数据和临床数据
3.5.2 分析结果
3.6 肝癌
3.6.1 表达数据和临床数据
3.6.2 分析结果
3.7 肺腺癌
3.7.1 表达数据和临床数据
3.7.2 分析结果
3.8 胃腺癌
3.8.1 表达数据和临床数据
3.8.2 分析结果
3.9 甲状腺癌
3.9.1 表达数据和临床数据
3.9.2 分析结果
3.10 数据库的构建
3.10.1 在线数据库IPFCdb
3.10.2 数据库IPFCdb的使用
3.10.3 网站其他部分
3.11 本章小结
第四章 总结与展望
4.1 全文总结
4.2 未来工作的展望
致谢
参考文献
附录
攻读硕士学位期间取得的成果
【参考文献】:
期刊论文
[1]中国鼻咽癌流行概况[J]. 梁锌,杨剑,高婷,张志超,陈艳佳,郑荣寿. 中国肿瘤. 2016(11)
本文编号:3732435
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 肿瘤的概述
1.2 常见恶性肿瘤
1.3 常见致癌因素
1.3.1 遗传因素
1.3.2 物理致癌因素
1.3.3 化学致癌因素
1.3.4 生物致癌因素
1.4 肿瘤预后生物标志物
1.5 TCGA数据库
1.6 本文结构
第二章 材料与方法
2.1 数据下载与整理
2.1.1 TCGA表达数据下载
2.1.2 TCGA临床数据下载
2.2 数据预处理
2.2.1 表达数据预处理
2.2.2 临床数据预处理
2.3 分析流程
2.3.1 筛选独立预后基因
2.4 本章小结
第三章 独立预后基因筛选与数据库的构建
3.1 膀胱尿路上皮癌
3.1.1 表达数据和临床数据
3.1.2 分析结果
3.2 肾透明细胞癌
3.2.1 表达数据和临床数据
3.2.2 分析结果
3.3 肾乳头状细胞癌
3.3.1 表达数据和临床数据
3.3.2 分析结果
3.4 胰腺癌
3.4.1 表达数据和临床数据
3.4.2 分析结果
3.5 结肠癌
3.5.1 表达数据和临床数据
3.5.2 分析结果
3.6 肝癌
3.6.1 表达数据和临床数据
3.6.2 分析结果
3.7 肺腺癌
3.7.1 表达数据和临床数据
3.7.2 分析结果
3.8 胃腺癌
3.8.1 表达数据和临床数据
3.8.2 分析结果
3.9 甲状腺癌
3.9.1 表达数据和临床数据
3.9.2 分析结果
3.10 数据库的构建
3.10.1 在线数据库IPFCdb
3.10.2 数据库IPFCdb的使用
3.10.3 网站其他部分
3.11 本章小结
第四章 总结与展望
4.1 全文总结
4.2 未来工作的展望
致谢
参考文献
附录
攻读硕士学位期间取得的成果
【参考文献】:
期刊论文
[1]中国鼻咽癌流行概况[J]. 梁锌,杨剑,高婷,张志超,陈艳佳,郑荣寿. 中国肿瘤. 2016(11)
本文编号:3732435
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3732435.html
最近更新
教材专著