基于数据分析的癌症标志物识别及肿瘤进展阶段分类研究
发布时间:2022-07-20 20:13
癌症种类繁多,日益频发,严重威胁了人类的生命健康.它的致病原因复杂多变,难以识别,治愈情况也不理想.早诊断早治疗可以提高癌症患者的生存率,但是受多方面因素的影响,很多癌症患者确诊时已处于中晚期,5年生存率很低.随着机器学习算法以及生物信息学的不断发展,利用基因表达数据对癌症诊断标志物的识别以及肿瘤进展阶段的研究,逐渐成为人们关注的热点之一,也对癌症早期诊断有着积极深远的意义.本研究旨在通过对大量芯片数据的分析,高通量筛选出癌症的特异性表达的基因,鉴定早期非小细胞肺癌的诊断标志物,同时研究肿瘤进展阶段的有效分类,提高癌症分期的分类精度.针对这两个方面,本文通过大量的文献研究,进行了如下工作:(1)对从GEO数据库中下载的76例早期非小细胞肺癌的重要基因表达数据进行了一系列的生物信息学分析,其中包括腺癌样本40例,鳞状细胞癌样本16例,健康样本20例.为了确定诊断的特异性标志物,我们将两种亚型分别与正常样本进行比较,以确定基因表达特征.通过无监督的多维定标分类分析,我们发现样本按照疾病亚型很好地聚类.基于分类结果,通过线性模型拟合和经验贝叶斯方法进行统计推断,共分析筛选出486个与该癌症相...
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景
1.2 研究现状
1.3 本文结构安排及创新点
第2章 基础理论知识
2.1 基因表达谱数据
2.2 基因表达数据库
2.3 生物信息学
2.4 特征选择
2.5 分类分析
第3章 关于早期非小细胞肺癌患者潜在诊断标志物的研究
3.1 材料与方法
3.2 结论
3.3 讨论
第4章 基于基因表达数据的特征选择和分类方法在肿瘤进展阶段的研究
4.1 材料与方法
4.2 结论
4.3 数据验证
4.4 讨论
第5章 总结与展望
参考文献
攻读硕士学位期间的科研成果
致谢
本文编号:3664688
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 研究背景
1.2 研究现状
1.3 本文结构安排及创新点
第2章 基础理论知识
2.1 基因表达谱数据
2.2 基因表达数据库
2.3 生物信息学
2.4 特征选择
2.5 分类分析
第3章 关于早期非小细胞肺癌患者潜在诊断标志物的研究
3.1 材料与方法
3.2 结论
3.3 讨论
第4章 基于基因表达数据的特征选择和分类方法在肿瘤进展阶段的研究
4.1 材料与方法
4.2 结论
4.3 数据验证
4.4 讨论
第5章 总结与展望
参考文献
攻读硕士学位期间的科研成果
致谢
本文编号:3664688
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3664688.html