女性特异性膀胱癌相关基因及其共表达网络分析
本文关键词:女性特异性膀胱癌相关基因及其共表达网络分析
更多相关文章: 膀胱癌 RNA-Seq 差异表达基因 共表达网络
【摘要】:背景膀胱癌是指发生在膀胱粘膜上的恶性肿瘤,其分类很多包括膀胱尿路上皮癌,膀胱腺癌、膀胱鳞状细胞癌等。通常我们所说的膀胱癌是指膀胱尿路上皮细胞癌,这种癌症占膀胱癌患者的90%。膀胱癌是我国泌尿系统最常见的恶性肿瘤,而在西方其在泌尿系统相关肿瘤中的发病率仅次于前列腺癌。在美国仅2015年就有7.4万膀胱癌新生病例,占所有癌症新生病例的4.5%。根据美国国家癌症研究所的统计,2015年美国全境有超过1.6万人死于膀胱癌,占由癌症引起的死亡人数的2.7%。2007-2012年在美国膀胱癌的五年生存率仅为77%。通常膀胱癌的发病率会随着年龄的增加而增加,其中50-70段年龄层的人口发病率最高,并且其在男性中的发病率远高于女性。全世界范围内,男性膀胱癌年龄标化的发病率为9.0/10万(居所有恶性肿瘤第七),女性年龄标化的发病率为2.2/10万(居所有恶性肿瘤第十八)。膀胱癌的发病率在发达国家(男性发病率16.6/10万,女性发病率3.6/10万)高于发展中国家(男性发病率5.4/10万,女性发病率1.4/10万)及欠发达国家(男性发病率1.5/10万,女性发病率0.3/10万)。其中欧洲及北美的膀胱癌被认为是膀胱癌高发地区,其男性年龄标化的发病率为20/10万,女性年龄标化的发病率为5/10万,有研究显示近年来这些地区女性膀胱癌的发病率和死亡率有轻微的降低,男性膀胱癌的发病率在减少而死亡率也趋于稳定。在我国,膀胱癌在男性中年龄标准化的发病率为7.37/10万,对于女性其年龄标化的发病率为1.98/10万处于中等水平。但是,由于社会的发展工业化以及人口老龄化等原因,膀胱癌在中国的发病状况不容乐观。有统计显示,近十年来在国内不论是在男性还是女性,农村还是城市,发病率均呈逐年增长的趋势。膀胱癌的发生是一个比较复杂的过程,既与环境因素相关也与遗传因素相关。其中吸烟被认为是导致膀胱癌发生的主要原因。但是,随着社会的发展,女性吸烟人数的增加,女性膀胱癌发病率并没有增加,相反在西方国家有降低的趋势。另外,与联苯胺类化学物质的频繁接触也是膀胱癌的诱因之一。司机、理发师、橡胶工人等与化学物质接触的职业的人群膀胱癌的发病率会更高。膀胱癌的发生同时也与遗传因素相关,有膀胱癌家族史的人患膀胱癌的概率比没有膀胱癌的人概率要更高。一方面这可能与同一家族内有相似的化学接触经历相关,另一方面也可能是与身体对毒素排解相关的一些基因发生改变,导致膀胱癌的发生。另外有对于膀胱癌的遗传性研究显示,膀胱癌患者的二三级亲属的膀胱癌发病率(10%)远高于一级亲属(3%)。大量的针对膀胱癌的癌症基因组分析已经发现癌基因H-ras、FGFR3、erbB2、 CCND1、mdm2,抑癌基因INK4A/ARF、Rb、TP53、PTEN、TSC1、PTCH、DBCCR1等, DNS错配修复基因等基因的突变会与膀胱癌的发生相关。膀胱癌是一种在男性和女性中均会发生的一种泌尿系统恶性肿瘤,其男性发病率是女性的3~4倍。通常吸烟被认为是导致膀胱癌发病率性别差异的重要原因,有研究显示至少一半的男性膀胱癌的发生和三分之一的女性膀胱癌的发生是与吸烟有关。但是有研究显示吸烟并不能完全解释导致膀胱癌发病率的性别差异的原因。因此,有必要在基因水平上寻找膀胱癌发病率性别差异的原因。有实验证明,位于X染色体(q11-12)的雄激素受体(AR)基因可能是导致膀胱癌发病率性别差异的原因之一。雄激素受体与配体结合生成的转录因子可以调节靶基因的表达。实验发现雄激素受体对正常的膀胱癌上皮细胞的生长和维持有着重要的作用。因此,雄激素受体的突变会失去其与配体的结合能力,导致膀胱癌的发生和发展。高通量测序技术的高速发展,对癌症的研究提供了更丰富的平台和数据基础,研究者可以从更多不同的角度,研究癌症在特定时期特定组织的特异性的表达。这些都为人类探索疾病的复杂的发生发展过程提供了良好的分析基础。目前对膀胱癌的研究还不能完全解释膀胱癌的发病机制,以及导致膀胱癌发病率性别差异的原因,因此有必要对其进行进一步的探索。目的本研究的目的在于利用公共数据库TCGA中提供的膀胱癌RNA-Seq数据,筛选潜在的女性特异表达的膀胱癌相关基因。以探究是女性膀胱癌中是否存在与男性不同的与膀胱癌发生相关的基因。同时,通过建立女性膀胱癌潜在相关基因的共表达网络,寻找筛选出女性特异性膀胱癌相关基因所在的共表达模块,通过对共表达网络模块的分析,了解其与女性膀胱癌之间的关系。方法本研究在差异表达分析的过程中使用R平台下的DESeq2和edgeR两种软件。这两种软件都是在R平台中对RNA-Seq差异表达分析比较成熟的软件,并且这二者都是基于基因表达符合负二项分布的假设。由于其对离散度的估计方法不同所以这两种软件在最后筛选差异表达基因结果会有一定的不同。为了使筛选到差异表达基因的结果更可信,我们选取二者分析结果的交集作为最终得到的差异表达基因。为了筛选出女性特异的膀胱癌相关基因,我们对从TCGA数据库中下载的238例膀胱癌相关样本(包括169例男性肿瘤,10例男性正常,52例女性肿瘤,7例女性正常)分别按照性别和癌症、正常分组。首先,分别筛选男性样本中膀胱癌与正常样本之间的差异表达基因,女性样本中膀胱癌和正常样本之间的差异表达基因。其次,对于所有的膀胱癌癌症组织样本我们按照性别筛选男性和女性之间的差异表达基因。最后,将女性膀胱癌与正常组织筛选出的差异表达基因去除在男性样本中筛选出的差异表达基因,并与按照癌症样本的性别筛选出的差异表达基因集取交集。最终得到女性特异性的膀胱癌相关基因。随后使用DAVID对这些基因进行基因注释了解其功能。为了进一步探索我们筛选出的差异表达基因与女性膀胱癌之间的关系,我们使用R语言下的WGCNA软件包,对TCGA数据库中下载得到的52例女性膀胱癌的RNA-Seq数据进行共表达网络的构建。寻找筛选出的差异表达基因所在的模块,并对这些模块进行GO功能分析和KEGG相关通路分析,使用Cytoscape对共表达网络中感兴趣的模块绘制该模块的共表达网络图。本研究中的差异表达分析以及构建共表达网络使用的分析软件DESeq2、 edgeR和WGCNA包,均是R语言平台下提供的生物信息分析软件。R语言是最常用的生物信息分析平台之一。与其他平台相比,R语言最大的优势是其是对使用者是完全免费开源的,并且具有强大的统计分析和图形绘制能力。其包含了多元的软件包,这些包都是由全世界数据分析领域的科研人员共同开发和维护的。结果对238例膀胱癌及其相关样本按照性别、癌症和正常分组,分别进行差异表达分析得到的结果如下:在所有男性样本中,癌症与正常样本之间使用DESeq2筛选出8249个差异表达基因,使用edgeR方法筛选出9048个差异表达基因,两种方法所得差异表达基因的交集有8076个基因。在所有女性样本中,癌症与正常样本间通过DESeq2得到3558个差异表达基因,使用edgeR方法筛选出4823个差异表达基因,两种方法所得到的差异表达基因的交集有3432个基因。在两种不同性别的癌症样本间筛选差异表达基因,DESeq2和edgeR分别筛选得到516和3988个差异表达基因,两种方法所得到差异表达基因的交集中有469个基因。最后我们将在两个方法共同得到的只在女性膀胱癌正常和癌症样本之间表达有差异,且在两种性别的肿瘤样本间表达也有差异的16个基因作为潜在的女性特异的膀胱癌相关基因。这些基因中有10个是表达上调基因,6个是表达下调基因。其中,CD36与微管内皮细胞凋亡的生物学过程相关,参与PPAR信号通路。NRG1是新近发现的一个抑癌基因,可与ERBB3/ERBB4结合促进细胞增殖和分化。COL4A3突变会导致基底膜肾病。TGFBI是转化生长因子β诱导的分泌蛋白,该蛋白具有抗肿瘤的功能。KLKB1调节内在的凝血酶原活性的生物学过程相关是肺癌等诊断的生物标志物。PAQR8可结合孕激素参与卵子生成。对52例女性膀胱癌样本建立共表达网络,得到39个模块,其中11个模块与这16个筛选得到的女性特异的膀胱癌相关基因相关。其中模块grey60包含CD36和CHIN3这两个女性特异性的膀胱癌基因,且这两个基因同时也是这个模块的核心基因。这意味着这两个基因与模块涉及的生物学功能有很大的相关性。CD36与微管内皮细胞凋亡的生物学过程相关,参与PPAR信号通路。通过对这个模块进行生物信息学分析我们同样发现这个模块与PPAR信号通路相关。这样的结果同时也验证了我们共表达网络构建的可信性,以及通过共表达网络模块基因的分析推测筛选出的膀胱癌基因与膀胱癌之间的关系的可行性。模块black包含COL4A3和KLKBl这两个筛选出的差异表达基因,该模块与VEGF信号通路以及非小细胞肺癌相关。对各模块的分析结果也同样与单个基因的功能注释的结果吻合。模块brown包含筛选出的差异表达基因SHOX2,该模块与细胞循环、小细胞肺癌和非小细胞肺癌相关。模块green包含了筛选出的差异表达基因PEX11A,该模块与子宫内膜癌和P53信号通路相关。模块pink包含了差异表达基因LRRC4,该模块同样与P53信号通路,胰腺癌和小细胞肺癌相关。而包含差异表达基因TGFBI的模块steel blue,与NF-kb信号通路相关。同时综合这些模块相关的生物学功能,我们发现这些通路相关的生物学过程之间也存在着相互调节的作用,这些作用的共同发生可能是最终导致膀胱癌发生的原因。讨论本研究通过利用膀胱癌样本进行差异表达分析和共表达网络分析。根据膀胱癌正常和癌症样本,以及样本的性别为筛选因素,筛选出了女性特异性的膀胱癌相关基因。利用女性膀胱癌样本构建出了女性膀胱癌的共表达网络。利用筛选出的基因与其所在共表达网络模块之间的关系,通过对模块内基因集的生物信息学分析,推测筛选出的差异表达基因的功能同时验证其与膀胱癌的相关性。本文最后指出了本研究结果的意义以及不足以及下一步要进行的内容。本研究作为一个探究癌症在性别之间差异的范例,研究中使用的分析策略同样适用于其它水平数据及相关癌症的研究。若通过其它水平的数据得到本文相似的结论,那么分析的结果可能更有参考和指导意义。
【关键词】:膀胱癌 RNA-Seq 差异表达基因 共表达网络
【学位授予单位】:南方医科大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R737.14
【目录】:
- 摘要3-9
- ABSTRACT9-17
- 第一章 概论17-30
- 1.1 膀胱癌概述17-22
- 1.2 膀胱癌相关研究现状22-23
- 1.3 TCGA数据库介绍23-28
- 1.4 本文研究工作28-30
- 第二章 癌症样本及分析方法介绍30-41
- 2.1 膀胱癌样本来源30
- 2.2 RNASeq差异表达分析方法30-34
- 2.2.1 RNA-Seq与微阵列比较30-31
- 2.2.2 RNA-Seq存在的问题31
- 2.2.3 基于RNA-Seq数据筛选差异表达方法31-32
- 2.2.4 基于RNA-Seq数据检测差异表达方法比较32-34
- 2.3 共表达网络构建及分析方法34-39
- 2.3.1 无尺度分布35-36
- 2.3.2 定义基因共表达相关矩阵36
- 2.3.3 定义邻接函数并确定邻接函数的参数36
- 2.3.4 定义节点的相异度36-37
- 2.3.5 聚类分析确定基因模块37-38
- 2.3.6 WGCNA相关概念38-39
- 2.4 其他分析方法介绍39-41
- 第三章 膀胱癌相关基因性别差异表达分析41-50
- 3.1 材料和方法41-43
- 3.1.1 材料41
- 3.1.2 RNASeq表达数据的预处理41-42
- 3.1.3 筛选差异表达基因42-43
- 3.2 结果43-48
- 3.2.1 女性特异性膀胱癌相关差异表达基因43-45
- 3.2.2 注释及生物学特征45-48
- 3.3 讨论48-50
- 第四章 女性膀胱癌基因的共表达网络分析50-68
- 4.1 材料和方法51-52
- 4.1.1 材料51
- 4.1.2 数据的预处理51
- 4.1.3 数据分析方法51-52
- 4.2 结果52-65
- 4.2.1 去除离群样本52-53
- 4.2.2 选择构建网络参数53-55
- 4.2.3 构建共表达网络55-62
- 4.2.4 相关模块的生物信息学分析62-65
- 4.3 讨论65-68
- 第五章 总结68-71
- 参考文献71-76
- 附录76-94
- 攻读硕士期间发表论著94-95
- 致谢95-96
【相似文献】
中国期刊全文数据库 前10条
1 孙剑;王健琪;翟朝阳;;不相容双质粒共表达人内皮抑素及简化人纤溶酶原饼环区5[J];四川大学学报(医学版);2006年06期
2 王承兴,李晓艳,肖绘,邓锡云,曹亚,public.cs.hn.cn;一种检测同一部位两种蛋白共表达的新方法─CSA/SP双染色法[J];癌症;2000年07期
3 喻小亮;胡雄贵;谢达平;P.Trefil;邓缘;燕海峰;;人促红细胞生成素基因和GFP共表达的输卵管特异性表达载体的构建[J];现代生物医学进展;2009年13期
4 谢佳男;齐妍;赵阳;王增艳;赵莉佩;崔雪玲;柳忠辉;王轶楠;;激活素受体相互作用蛋白1,2在小鼠脑神经细胞中的共表达[J];中国生物制品学杂志;2013年07期
5 李毅,柴玉波,蒲勤,陈南春,陈苏民;hBMP-3成熟肽与人PDI分子片段在大肠杆菌中的共表达[J];第四军医大学学报;2002年S1期
6 孟宪敏,米立国,曹慧青,赵秀文,刘冬青,高润霖,丁金凤;双基因共表达在血管再狭窄研究中的应用[J];解剖学报;2003年06期
7 刘之荣;范文辉;李露斯;;pEBFP/FP6共表达质粒转染神经干细胞的实验研究[J];西北国防医学杂志;2007年02期
8 李秀英;夏良平;赖延东;;PFP、GrB真核共表达载体的构建及表达分析[J];中国免疫学杂志;2008年06期
9 朱可彤;王小丹;杜娟;郭博;孔维;于湘晖;;HIV-1 Vif与ElonginC蛋白在大肠杆菌中的共表达[J];中国生物制品学杂志;2008年07期
10 许凌峰,夏志平,郭志儒,王宏,王兴龙,金宁一;新城疫病毒F基因与传染性法氏囊病毒VP0基因在鸡痘病毒中共表达[J];中国生物制品学杂志;2002年05期
中国重要会议论文全文数据库 前5条
1 周鹏;查向东;王作利;;共表达阴离子配体生产重组阳离子抗菌肽的研究[A];格莱姆抗菌肽——抗菌肽开发与应用技术研讨会论文集[C];2009年
2 陈永井;王勤;周迎会;王雪峰;谢芳;於葛华;张学光;;PD-1/PD-L1在T细胞上的共表达及其生物学意义[A];中国免疫学会第五届全国代表大会暨学术会议论文摘要[C];2006年
3 孙中文;邱玉华;王凤鸣;孙玮丽;程钢;徐耀瑜;胡玲玲;张学光;;GL50/ICOS在活化T细胞上的共表达及其生物学意义[A];中国免疫学会第五届全国代表大会暨学术会议论文摘要[C];2006年
4 孙中文;邱玉华;王凤鸣;马泓冰;程钢;徐耀瑜;胡玲玲;张学光;;GL50/ICOS在活化T细胞上的共表达及生物学意义[A];中国细胞生物学学会第九次会员代表大会暨青年学术大会论文摘要集[C];2007年
5 李镝锐;汪明;;基于秀丽隐杆线虫IRES序列双框共表达载体的构建[A];中国畜牧兽医学会家畜寄生虫学分会第六次代表大会暨第十一次学术研讨会论文集[C];2011年
中国博士学位论文全文数据库 前4条
1 任燕;基于共表达网络探讨长非编码RNA对早发精神分裂症的调控作用[D];山西医科大学;2015年
2 杨竞;疾病间相关关系的研究及其研究方法的开发[D];华东理工大学;2015年
3 徐莉;人补体调节蛋白基因的克隆、共表达及功能研究[D];武汉大学;2005年
4 孙秀丽;植物基因表达数据库的构建及共表达分析研究[D];吉林大学;2013年
中国硕士学位论文全文数据库 前10条
1 周倩雯;贪噬菌CGMCC 4969的噻虫啉水解酶基因簇共表达促进噻虫啉和3-氰基吡啶生物转化的研究[D];南京师范大学;2013年
2 周晓天;(R)-羰基还原酶与葡萄糖脱氢酶于大肠杆菌中共表达及手性催化[D];江南大学;2016年
3 李丹妮;女性特异性膀胱癌相关基因及其共表达网络分析[D];南方医科大学;2016年
4 王庆;基于蛋白质互作网络和转录共表达的疾病基因排序方法研究[D];上海交通大学;2014年
5 吴素娟;基于差异共表达方法对胶质瘤分子分型的研究以及对疾病间相关关系数据库的开发[D];华东理工大学;2015年
6 姜琪;共表达磷脂酶C强化大肠杆菌重组蛋白的胞外表达[D];江南大学;2015年
7 贺东亮;苦荞过敏原共表达及TBb抗原表位的研究[D];山西大学;2009年
8 蔡海莺;3C融合蛋白介导的多蛋白共表达[D];华中农业大学;2009年
9 谢月;MDCKⅡ-hMDR1/hBCRP共表达细胞株平台的建立及生物学功能研究[D];苏州大学;2014年
10 李小月;一株呼吸道合胞病毒融合糖蛋白F和EGFP共表达的非复制型腺病毒重组体的构建、鉴定及表达[D];安徽医科大学;2005年
,本文编号:1008566
本文链接:https://www.wllwen.com/yixuelunwen/mjlw/1008566.html