基于基因表达数据的胃癌特征基因选取及生存分析
发布时间:2023-02-10 21:06
随着人类基因组计划的完成,基因芯片技术被广泛应用在科学研究的各个领域,也使生命科学进入了全基因组和大数据的时代。大量基于基因芯片技术获得的基因表达数据在许多专业数据库上有公开的存储,这为基因表达数据的相关研究提供了必要的数据支撑。另一方面,癌症作为对人类最致命的疾病之一,科学家和医学工作者们始终致力于对癌症早期诊疗的研究,基因芯片技术则为探究癌症分子水平特征提供可能。当今,胃癌已成为全球排名第四最普遍被诊断、死亡率排名第三的癌症。因此对胃癌患者的基因表达数据进行特征选取,使用特征基因进行与患者临床相关的数据分析是十分有价值的。本文在GDC平台上的TCGA数据库中下载了胃癌患者的基因表达数据和相应的临床数据。在对初始数据集进行整合与清洗后,采用了过滤与封装相结合的特征选取方法来筛选特征基因。通过构建分类模型检验了筛选的特征基因集能对样本进行有效地分类。将特征基因集与胃癌患者临床数据结合进行生存分析的结果,也显示了该基因集中特征基因的表达量水平能显著地影响胃癌患者的生存情况。本文的主要工作可以分为以下三个部分:1.胃癌特征基因的选取。基因表达数据具有有高维度、小样本的特点,所以特征间常常会...
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
中文摘要
ABSTRACT
第1章 引言
1.1 研究背景及意义
1.2 国内外研究综述
1.3 本文研究内容
1.4 本研究的优势与不足
第2章 TCGA数据库与数据下载
2.1 TCGA数据库介绍
2.2 TCGA数据下载
第3章 特征选择方法介绍
3.1 特征选择概述
3.2 本文筛选特征基因的主要方法
第4章 分类方法介绍
4.1 分类方法概述
4.2 支持向量机
4.3 分类模型评价
第5章 生存分析介绍
5.1 生存分析与生存函数
5.2 生存分析相关模型
第6章 实证部分
6.1 数据处理
6.2 特征基因筛选
6.3 特征基因结果对比讨论
6.4 基于特征基因的临床数据分析
第7章 总结与展望
7.1 总结
7.2 展望
参考文献
致谢
本文编号:3739912
【文章页数】:63 页
【学位级别】:硕士
【文章目录】:
中文摘要
ABSTRACT
第1章 引言
1.1 研究背景及意义
1.2 国内外研究综述
1.3 本文研究内容
1.4 本研究的优势与不足
第2章 TCGA数据库与数据下载
2.1 TCGA数据库介绍
2.2 TCGA数据下载
第3章 特征选择方法介绍
3.1 特征选择概述
3.2 本文筛选特征基因的主要方法
第4章 分类方法介绍
4.1 分类方法概述
4.2 支持向量机
4.3 分类模型评价
第5章 生存分析介绍
5.1 生存分析与生存函数
5.2 生存分析相关模型
第6章 实证部分
6.1 数据处理
6.2 特征基因筛选
6.3 特征基因结果对比讨论
6.4 基于特征基因的临床数据分析
第7章 总结与展望
7.1 总结
7.2 展望
参考文献
致谢
本文编号:3739912
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3739912.html
最近更新
教材专著