基于生物信息学方法识别肺鳞状细胞癌预后相关基因及拟合预测风险模型
发布时间:2022-02-08 22:14
肺鳞状细胞癌(lung squamous cell carcinoma,LUSC)简称肺鳞癌,是非小细胞肺癌中一类常见的病理类型。由于其发病隐蔽,往往发现时已属晚期,加上缺乏有效的靶向治疗药物等因素,肺鳞癌患者的预后差,因此迫切需要找到与肺鳞癌预后相关的生物标志物,为临床治疗提供策略,改善患者的预后。本研究基于NCBI的GEO和TCGA两个大型肿瘤基因组组学数据库,利用生物信息学的方法筛选肺鳞癌预后相关基因,建立预测风险模型。1、从GEO中下载肺鳞癌的基因表达谱数据和TCGA的转录组数据及临床随访信息,分别利用R语言中Bioconductor的“affy”和“edgeR”包进行对数据进行预处理。2、基于癌样本中基因表达值的中位数绝对偏差值,分别在数据集中筛选75%差异最大的基因。3、为了筛选出可靠的差异基因,选择在各个GEO数据集及TCGA的转录组数据中均是有异常表达的基因作为我们的异常表达基因。4、对筛选出的异常表达基因进行生存分析。将基因在正常样本中的平均表达水平设置为阈值,进行分组(大于其阈值为高表达组,反之为低表达组)。根据log-rank检验,P<0.01认为有统计学意...
【文章来源】:南昌大学江西省211工程院校
【文章页数】:50 页
【学位级别】:硕士
【部分图文】:
GEO数据集和TCGA数据共有的异常表达的基因(n=7925)
图 3.2 训练集(n=325)中 11 基因模型的预测效果评估为了进一步的验证我们 11 基因模型的预测能力和可靠性。我们在验证集中进行了验证。根据同样的方法,我们在验证集中计算了基于 11 基因模型的风险得分,利用 ROC 曲线进行预测了未来 3 年的总生存率,ROC 曲线下的面积AUC=0.711。表明该模型在验证集中具有较好的预测能力和可靠性。根据在训练集中得到的最佳阈值 1.499,验证集同样被分为高风险组和低风险组,风险的分
图 3.3 11 基因模型在验证集(n=139)中的预测效果评估此外,我们也将训练集和验证集整合起来进一步的验证该模型的预测能力靠性,在 464 个样本中,我们进行绘制 ROC 曲线,同样预测 3 年的总生存结果表明,ROC 曲线的下的面积为 AUC=0.748,说明我们的 11 基因模型具好的稳定性。在整合的数据集中,高风险组(n=150),低风险组(n=314),比较两组的总生存,根据 log rank 检验结果表明高风险组的患者总生存时
【参考文献】:
期刊论文
[1]高危职业暴露与肺癌临床特征的相关性分析[J]. 韩书阁,郭云岭,冯晓英,程瑞清. 中国肿瘤. 2018(10)
[2]TBC蛋白家族成员在人类疾病发生发展中的作用[J]. 施梦婷,张莹,周钢桥. 遗传. 2018(01)
[3]营养与肺癌的关系及肺癌患者营养干预[J]. 张冉,刘杰,林洪生,王宜. 中国中西医结合外科杂志. 2017(05)
[4]吸烟对wnt/β-catenin信号转导途径的激活情况及与肺鳞状细胞癌发病率的相关性[J]. 王松. 中国综合临床. 2017 (02)
[5]焦化厂职业暴露与肺癌关系研究进展[J]. 王阳,王一婧. 山西医药杂志. 2015(09)
[6]吸烟、被动吸烟与肺癌发病风险的病例对照研究[J]. 刘志强,何斐,蔡琳. 中华疾病控制杂志. 2015(02)
[7]肺鳞癌驱动基因及其靶向治疗的研究进展[J]. 黄芳,李颖,姜达. 肿瘤学杂志. 2014(12)
[8]p63与表皮生长因子受体突变肺鳞癌患者生存的关系[J]. 王碧波,韩一平,万善志,黄玲,马大烈,郑建明,李强. 第二军医大学学报. 2014(04)
[9]肺鳞癌全基因组lncRNAs表达研究[J]. 王瑛,尹继业,李湘平,陈娟,钱晨月,郑艺,刘昭前. 肿瘤药学. 2013(04)
[10]生存分析的方法及应用[J]. 罗胜兰,俞敏. 浙江预防医学. 2013(05)
本文编号:3615848
【文章来源】:南昌大学江西省211工程院校
【文章页数】:50 页
【学位级别】:硕士
【部分图文】:
GEO数据集和TCGA数据共有的异常表达的基因(n=7925)
图 3.2 训练集(n=325)中 11 基因模型的预测效果评估为了进一步的验证我们 11 基因模型的预测能力和可靠性。我们在验证集中进行了验证。根据同样的方法,我们在验证集中计算了基于 11 基因模型的风险得分,利用 ROC 曲线进行预测了未来 3 年的总生存率,ROC 曲线下的面积AUC=0.711。表明该模型在验证集中具有较好的预测能力和可靠性。根据在训练集中得到的最佳阈值 1.499,验证集同样被分为高风险组和低风险组,风险的分
图 3.3 11 基因模型在验证集(n=139)中的预测效果评估此外,我们也将训练集和验证集整合起来进一步的验证该模型的预测能力靠性,在 464 个样本中,我们进行绘制 ROC 曲线,同样预测 3 年的总生存结果表明,ROC 曲线的下的面积为 AUC=0.748,说明我们的 11 基因模型具好的稳定性。在整合的数据集中,高风险组(n=150),低风险组(n=314),比较两组的总生存,根据 log rank 检验结果表明高风险组的患者总生存时
【参考文献】:
期刊论文
[1]高危职业暴露与肺癌临床特征的相关性分析[J]. 韩书阁,郭云岭,冯晓英,程瑞清. 中国肿瘤. 2018(10)
[2]TBC蛋白家族成员在人类疾病发生发展中的作用[J]. 施梦婷,张莹,周钢桥. 遗传. 2018(01)
[3]营养与肺癌的关系及肺癌患者营养干预[J]. 张冉,刘杰,林洪生,王宜. 中国中西医结合外科杂志. 2017(05)
[4]吸烟对wnt/β-catenin信号转导途径的激活情况及与肺鳞状细胞癌发病率的相关性[J]. 王松. 中国综合临床. 2017 (02)
[5]焦化厂职业暴露与肺癌关系研究进展[J]. 王阳,王一婧. 山西医药杂志. 2015(09)
[6]吸烟、被动吸烟与肺癌发病风险的病例对照研究[J]. 刘志强,何斐,蔡琳. 中华疾病控制杂志. 2015(02)
[7]肺鳞癌驱动基因及其靶向治疗的研究进展[J]. 黄芳,李颖,姜达. 肿瘤学杂志. 2014(12)
[8]p63与表皮生长因子受体突变肺鳞癌患者生存的关系[J]. 王碧波,韩一平,万善志,黄玲,马大烈,郑建明,李强. 第二军医大学学报. 2014(04)
[9]肺鳞癌全基因组lncRNAs表达研究[J]. 王瑛,尹继业,李湘平,陈娟,钱晨月,郑艺,刘昭前. 肿瘤药学. 2013(04)
[10]生存分析的方法及应用[J]. 罗胜兰,俞敏. 浙江预防医学. 2013(05)
本文编号:3615848
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3615848.html
最近更新
教材专著