基于GEO数据库的子宫颈鳞状上皮内病变进展关键基因和通路筛选
发布时间:2020-04-01 14:34
【摘要】:目的:基于GEO数据库,我们寻找在子宫颈鳞状上皮内病变进展过程中关键基因和通路的改变,用转录组测序数据验证得到的关键基因并在宫颈癌中进一步探究其和FIGO分期的关系。方法:从GEO数据库下载GSE63514、GSE27678、GSE7803三个数据集的基因表达谱数据,用标准化流程处理数据。对不同分组的子宫颈病变进行异质性分析。利用生物信息学方法筛选宫颈病变进展过程中关键基因和通路。分析关键基因表达和宫颈病变程度的关系并利用既往项目转录组测序数据进行验证。分析关键基因的表达和宫颈癌FIGO分期的关系。结果:子宫颈病变异质性分析显示:当子宫颈病变进展到宫颈癌时,异质性显著增加。基于差异表达基因的KEGG通路富集分析显示:IL-17信号通路可能是宫颈病变恶性进展中的重要通路;MAPK信号通路可能和子宫颈鳞状上皮内病变的发生相关。蛋白网络互作分析及关键基因筛选,共得到AURKA、TOP2A、CEP55和RFC4四个核心基因(Hub Gene)。Hub基因表达量和宫颈病变程度呈正相关,转录组测序数据验证得到相同的结果。Hub基因的表达和宫颈癌FIGO分期的关系分析显示:Hub基因在不同FIGO分期的宫颈癌组织中表达均无显著差异。结论:AURKA、TOP2A、CEP55和RFC4与子宫颈病变恶性进展有密切关系,其可能为宫颈癌的治疗靶点、宫颈病变诊断分子标志物。或也可用来预测LSIL恶性进展概率,提高宫颈癌筛查的准确性。
【图文】:
7图 2-1 实验总体设计流程2.2.1 基因芯片数据下载及质控利用Bioconductor的GEOquery[14]包从NCBI的GEO数据库下载GSE63514、GSE27678 和 GSE7803 的“series matrix files”。其中 GSE63514 和 GSE27678 数据已经用 RMA(Robust MultichipAverage)算法标准化,GSE7803 数据已做分位数标准化(quantiles)。用 hgu133plus2.db、hgu133a2.db 和 hgu133a.db 分别注释以上三个数据集的基因芯片。当多个探针对应一个基因时,则取该数据集内所有芯片平均表达量最大的探针作为该基因的表达量。
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R737.33
本文编号:2610583
【图文】:
7图 2-1 实验总体设计流程2.2.1 基因芯片数据下载及质控利用Bioconductor的GEOquery[14]包从NCBI的GEO数据库下载GSE63514、GSE27678 和 GSE7803 的“series matrix files”。其中 GSE63514 和 GSE27678 数据已经用 RMA(Robust MultichipAverage)算法标准化,GSE7803 数据已做分位数标准化(quantiles)。用 hgu133plus2.db、hgu133a2.db 和 hgu133a.db 分别注释以上三个数据集的基因芯片。当多个探针对应一个基因时,则取该数据集内所有芯片平均表达量最大的探针作为该基因的表达量。
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R737.33
【参考文献】
相关博士学位论文 前1条
1 马玉花;极光激酶A对宫颈鳞状细胞癌的影响及其机制研究[D];新疆医科大学;2017年
,本文编号:2610583
本文链接:https://www.wllwen.com/yixuelunwen/fuchankeerkelunwen/2610583.html
最近更新
教材专著