肺鳞状细胞癌差异表达基因及其与DNA甲基化的关联
发布时间:2021-02-19 08:10
差异表达基因和DNA甲基化修饰的改变在肿瘤的发生进展中共同发挥重要作用,为了探索肺鳞状细胞癌发生的分子机制,本文基于TCGA公共数据库肺鳞状细胞癌的RNA-Seq和450k甲基化数据,利用R包DESeq2和方差分析获得差异表达基因,并根据组内和组间差异构建了5个基因集合。参考COSMIC、DISEASES及CCGD数据库中的癌基因信息,统计分析了癌基因在各基因集合中的分布。根据COSMIC和Nucleic Acids Res数据库中的原癌和抑癌基因列表,分析了原癌和抑癌基因在集合中的分布。最后,选取了组间差异极显著的高、低表达基因为研究对象,分析其在癌组织和正常组织中DNA甲基化水平的分布,并研究了基因表达水平与DNA甲基化水平的关系。结果显示,癌基因在5个集合中所占比例分别为:47.2%,38.7%,61.6%,55.6%,38.2%;肺癌基因在各集合中所占比例为:2.3%,0.9%,1.5%,2.2%,0.9%,找到72个潜在原癌基因和244个潜在抑癌基因,表明了经方差分析进一步筛选的高、低表达,组间差异集合中含有较多癌基因与肺癌基因。研究发现,DNA甲基化修饰水平在上、下调基因的...
【文章来源】:内蒙古大学内蒙古自治区 211工程院校
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
组内波动较大的基因表达值分布
内蒙古大学硕士毕业论文133.2癌基因在差异与非差异基因集合中的分布基于3.1中的肺鳞状细胞癌差异表达基因数据库及癌基因信息,我们又进一步统计了癌基因和肺癌基因分别在组内、组间差异表达基因以及非差异基因集合中的分布情况,其中癌基因类型涉及广泛,包含肺癌、乳腺癌和肾母细胞瘤等多种肿瘤,肺癌基因则包括来自各大肿瘤数据库的LungCancer,BOTH,LUSC或LUAD标识的基因。发现癌基因占upB、upI、downB、downI和none集合的比率分别为:47.2%,38.7%,61.6%,55.6%,38.2%(图3.1(a)),肺癌基因占各集合的比率分别为:2.3%,0.9%,1.5%,2.2%和0.9%(图3.1(b))。图中横坐标表示5个差异与非差异表达基因集合,纵坐标表示集合中的基因数,黑色标识代表基因集合,浅灰色标识代表对应集合中出现的癌基因(a)和肺癌基因(b)。(a)(b)图3.1癌基因(a)和肺癌基因(b)在肺鳞状细胞癌5个集合中的分布Fig.3.1DistributionofcancerandlungcancergenesinfivesetsofLUSC结果显示,癌基因在DESeq2筛选的差异表达基因中占比50.7%,明显高于其在非差异表达基因中的比例38.2%;肺癌基因在差异表达基因中占比1.75%,也高于其在非差异表达基因的比例0.90%。进一步统计发现,这些癌基因在upB和downB基因集合中的比率明显高于upI、downI与none集合;肺癌基因则占upB、downB、downI基因集合的比例相对于其占upI和none基因集合的比例较高,这里肺癌基因在downI集合中比率略大于在downB集合的比率,原因可能是收集到的肺鳞状细胞癌基因不够全面以及downB、downI两基因集合中基因基数差距过大。
内蒙古大学硕士毕业论文143.3潜在原癌和抑癌基因分析3.3.1潜在原癌和抑癌基因的寻找我们推测肿瘤的上调基因与原癌基因的共有基因可能是潜在原癌基因,而肿瘤下调基因与抑癌基因的共有基因可能是潜在的肿瘤抑制基因,由此,利用R包VennDiagram绘制韦恩图获取所有原癌基因列表与upB、所有抑癌基因列表与downB基因集合的交集,得到80个潜在原癌基因(图3.2(a))和260个潜在抑癌基因(图3.2(b)),基因列表如附表1所示。(a)(b)图3.2肺鳞状细胞癌的潜在原癌与抑癌基因集合Fig.3.2PotentialoncogeneandtumorsuppressorgenesetsinLUSC通过比对差异表达基因数据库中的信息,发现潜在原癌基因集合和抑癌基因集合中已有确定的肺鳞状细胞癌原癌基因8个,抑癌基因16个,在附表1中以粗体表示。3.3.2GO功能富集分析我们对上一节获得的潜在原癌和抑癌基因列表,深入分析其参与的生物学功能以及代谢、信号等生物学通路,更全面地了解这些基因在生命活动中扮演的角色及其与肿瘤发生过程的关系,功能富集分析结果如表3.3所示,p-onco表示潜在原癌基因,p-TSG表示潜在抑癌基因。p-onco的富集的分子功能(MF)包括聚合酶II近端启动子序列特异性DNA结合,染色质结合和转录辅助调节因子活性。生物过程(BP)主要在区域化,生长发育和细胞
【参考文献】:
期刊论文
[1]基于TCGA数据库结肠癌RBL1基因甲基化水平的诊断与预后分析[J]. 潘冉冉,季慧慧,黄天怡,胡豪畅,段世伟. 中国细胞生物学学报. 2019(02)
[2]肺鳞状细胞癌癌症发展模式识别分类模型及特征基因识别[J]. 张飞,王世祥,王玲,宋凯. 生物化学与生物物理进展. 2016(01)
[3]肺鳞癌分子靶向治疗的研究现状[J]. 李亚楠,周云芝,王洪武. 中国肺癌杂志. 2014(08)
硕士论文
[1]基于RNA-Seq数据的差异表达基因检测算法研究[D]. 张宁.大连海事大学 2017
本文编号:3040842
【文章来源】:内蒙古大学内蒙古自治区 211工程院校
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
组内波动较大的基因表达值分布
内蒙古大学硕士毕业论文133.2癌基因在差异与非差异基因集合中的分布基于3.1中的肺鳞状细胞癌差异表达基因数据库及癌基因信息,我们又进一步统计了癌基因和肺癌基因分别在组内、组间差异表达基因以及非差异基因集合中的分布情况,其中癌基因类型涉及广泛,包含肺癌、乳腺癌和肾母细胞瘤等多种肿瘤,肺癌基因则包括来自各大肿瘤数据库的LungCancer,BOTH,LUSC或LUAD标识的基因。发现癌基因占upB、upI、downB、downI和none集合的比率分别为:47.2%,38.7%,61.6%,55.6%,38.2%(图3.1(a)),肺癌基因占各集合的比率分别为:2.3%,0.9%,1.5%,2.2%和0.9%(图3.1(b))。图中横坐标表示5个差异与非差异表达基因集合,纵坐标表示集合中的基因数,黑色标识代表基因集合,浅灰色标识代表对应集合中出现的癌基因(a)和肺癌基因(b)。(a)(b)图3.1癌基因(a)和肺癌基因(b)在肺鳞状细胞癌5个集合中的分布Fig.3.1DistributionofcancerandlungcancergenesinfivesetsofLUSC结果显示,癌基因在DESeq2筛选的差异表达基因中占比50.7%,明显高于其在非差异表达基因中的比例38.2%;肺癌基因在差异表达基因中占比1.75%,也高于其在非差异表达基因的比例0.90%。进一步统计发现,这些癌基因在upB和downB基因集合中的比率明显高于upI、downI与none集合;肺癌基因则占upB、downB、downI基因集合的比例相对于其占upI和none基因集合的比例较高,这里肺癌基因在downI集合中比率略大于在downB集合的比率,原因可能是收集到的肺鳞状细胞癌基因不够全面以及downB、downI两基因集合中基因基数差距过大。
内蒙古大学硕士毕业论文143.3潜在原癌和抑癌基因分析3.3.1潜在原癌和抑癌基因的寻找我们推测肿瘤的上调基因与原癌基因的共有基因可能是潜在原癌基因,而肿瘤下调基因与抑癌基因的共有基因可能是潜在的肿瘤抑制基因,由此,利用R包VennDiagram绘制韦恩图获取所有原癌基因列表与upB、所有抑癌基因列表与downB基因集合的交集,得到80个潜在原癌基因(图3.2(a))和260个潜在抑癌基因(图3.2(b)),基因列表如附表1所示。(a)(b)图3.2肺鳞状细胞癌的潜在原癌与抑癌基因集合Fig.3.2PotentialoncogeneandtumorsuppressorgenesetsinLUSC通过比对差异表达基因数据库中的信息,发现潜在原癌基因集合和抑癌基因集合中已有确定的肺鳞状细胞癌原癌基因8个,抑癌基因16个,在附表1中以粗体表示。3.3.2GO功能富集分析我们对上一节获得的潜在原癌和抑癌基因列表,深入分析其参与的生物学功能以及代谢、信号等生物学通路,更全面地了解这些基因在生命活动中扮演的角色及其与肿瘤发生过程的关系,功能富集分析结果如表3.3所示,p-onco表示潜在原癌基因,p-TSG表示潜在抑癌基因。p-onco的富集的分子功能(MF)包括聚合酶II近端启动子序列特异性DNA结合,染色质结合和转录辅助调节因子活性。生物过程(BP)主要在区域化,生长发育和细胞
【参考文献】:
期刊论文
[1]基于TCGA数据库结肠癌RBL1基因甲基化水平的诊断与预后分析[J]. 潘冉冉,季慧慧,黄天怡,胡豪畅,段世伟. 中国细胞生物学学报. 2019(02)
[2]肺鳞状细胞癌癌症发展模式识别分类模型及特征基因识别[J]. 张飞,王世祥,王玲,宋凯. 生物化学与生物物理进展. 2016(01)
[3]肺鳞癌分子靶向治疗的研究现状[J]. 李亚楠,周云芝,王洪武. 中国肺癌杂志. 2014(08)
硕士论文
[1]基于RNA-Seq数据的差异表达基因检测算法研究[D]. 张宁.大连海事大学 2017
本文编号:3040842
本文链接:https://www.wllwen.com/shoufeilunwen/mpalunwen/3040842.html
最近更新
教材专著