当前位置:主页 > 科技论文 > 基因论文 >

基于基因表达谱和蛋白-蛋白相互作用网络的乳腺癌相关特异性基因的识别

发布时间:2020-08-09 13:16
【摘要】:乳腺癌是一种对女性健康产生严重威胁的恶性肿瘤,目前的诊断及治疗效果较差。进一步识别乳腺癌相关的基因对于乳腺癌的治疗和诊断精确度的提高具有重大意义。再者,目前生物信息学的方法广泛地应用于疾病相关基因识别,为实验提供了重要的理论指导。故本研究基于生物信息学的方法进行乳腺癌相关基因的识别。(1)以乳腺癌为研究对象,将GEO数据库中表达谱数据集作为数据源。对原始数据进行背景校正、标准化及汇总等预处理操作,随后利用最大相关最小冗余的特征提取算法和Dijkstra最短路径算法对乳腺癌相关基因进行预测。然后去随机因素,最终得到乳腺癌的候选基因。(2)以三阴性乳腺癌为研究对象,我们将GEO数据库中表达谱数据集作为数据源。同样方法获得与三阴性乳腺癌具有最强相关性的候选基因,将这些候选基因与上述从乳腺癌分析中获得的候选基因取交集,得到最终的三阴性乳腺癌的候选基因。最后对候选基因进行GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析。最终筛选出19个与乳腺癌具有最显著相关性的候选基因。这19个基因其中大部分已被报道与乳腺癌确有直接关系。GO富集分析表明这些基因主要与氧水平和转录相关。KEGG富集分析表明这些基因主要富集于前列腺癌路径、内分泌拮抗和癌症相关通路。最终得到54个与三阴性乳腺癌相关的基因。这些基因其中大部分已被报道确与乳腺癌有直接的关系,同时其中另一些基因如MAGOH、RPS3、JUN、HCFC1、OGT、PPP1CB、CFTR及ESR1目前少见报道,提示可能是乳腺癌相关的新特异基因,有待实验验证。GO富集分析表明这些基因主要与黏附作用和转录有关。KEGG富集分析表明这些基因可能与病毒致癌有关。本研究的主要创新点:(1)将基因表达谱和PPI数据进行整合,用PPI网络的系统生物学方法研究基因表达谱数据。(2)将基因看作特征,基于最大相关最小冗余特征筛选算法以及最短路径算法筛选出与疾病显著相关的基因。最后利用GO分析与KEGG富集分析找出这些基因参与最多的信号通路和功能,以此推断与乳腺癌有关的重要潜在生物学机制和生物途径。本文为乳腺癌相关的基因识别提供了有效的方法和手段,对乳腺癌的进一步研究提供了一定的理论支持。
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R737.9;TP301.6
【图文】:

流程图,流程图,数据,乳腺癌


前 24 个基因做乳腺癌的候选基因。排除 5 个随机因素后,基于 R 语言的clusterProfiler 包对剩余 19 个基因进行 GO 富集分析和 KEGG 通路富集分析。2.2.1 芯片数据来源本实验数据源为 GEO(https://www.ncbi.nlm.nih.gov/geo/)数据库,是当今最大的、最全面的公共基因表达资源。GEO 全称为 Gene Expression Omnibus,是一个免费的微阵列数据、下一代测序和其他高通量测序的数据的平台。该数据库由美国国家医学图书馆国家生物技术信息中心(NCBI)建立和维护,目前公共区域可获得大于一百万数据样本,并且样本数量在不断地增长。GEO 提供的主要的数据有:(1)GSE:原始数据,以此开头的 ID 号为研究的 ID;(2)GSD:背景校正和归一化后的数据;(3)GSM:样本数据,一个 GSE 包含多个 GSM;(4)GPL:芯片平台描述数据,通常只有同一平台的数据才可以进行比较。本研究选择乳腺癌的基因表达谱数据集 GSE9574。该文件包含 29 个样本文件,其中,14 个样本来自乳腺癌组织内的上皮细胞,15 个样本来自正常组织的上皮细胞。

对数图,原始数据


天津大学硕士学位论文首先,运用相对对数(RLE)箱图的可靠性,如图 2-2 所示,一个探针组在某个样本的表达值除以该探针组在所有样本中表达值的中位数后取对数。箱线图中间的黑线代表中位数,所有的黑线接近 0 线说明数据是可靠的。然后利用 R中的 limma 包的 RMA 算法对数据进行前处理,即背景校正、标准化和汇总。该算法处理过的数据时经过以 2 为底的对数转换的。在本研究中,我们将处理前和处理后的结果分别绘制为图 2-3、图 2-4。其中图 2-3 为原始数据,图 2-4 为 RMA算法预处理完的数据。该数据集来自平台 GPL96,基于此平台,我们将阵列号转换为相对应的基因。由于一个基因对应多个阵列号从而对应多个表达值,故本研究中将多个表达值的均值作为基因的表达值。最后,我们得到 12,437 个基因用来做接下来的处理。

最大相关,软件界面


利用最大相关最小冗余算法处理微阵列数据时,在相关和冗余之间的关系中具有最大的权衡性能的特征即为好的特征[31]。最大相关最小冗余方法对于从候选基因中减少冗余并且选择高准确率的基因子集非常有效。在本研究中我们利用基于 Peng 等的算法和发布的源代码改进后所自行开发的图形界面软件来实现,图 2-5 最大相关最小冗余软件界面图 2-6 输入的表达谱文件

【相似文献】

相关期刊论文 前10条

1 刘倩;金红艳;何为;葛四平;田勇;赵能刚;;乳腺癌组织微小RNA-218-5p的表达及其临床意义[J];临床肿瘤学杂志;2018年12期

2 高嘉悦;;乳腺癌的治疗现状及展望[J];中国新通信;2019年02期

3 郭奕阳;朱彩虹;郭秀娟;;人表皮生长因子受体2阳性乳腺癌与抗人表皮生长因子受体2新型药物[J];河北医科大学学报;2018年01期

4 闫东;;人表皮生长因子受体3在人表皮生长因子受体2阳性乳腺癌组织中的表达[J];肿瘤基础与临床;2017年06期

5 张青;甘淋;;乳腺癌生物标志物的研究进展[J];生命的化学;2018年01期

6 张斌;梁爱玲;刘勇军;;外泌体在乳腺癌中耐药机制的研究进展[J];中国医药生物技术;2018年02期

7 张国强;刘增艳;王晓红;杨振林;;血清微小RNA-409-3p表达在乳腺癌早期诊断中的价值[J];江苏医药;2018年04期

8 王晨飞;胡浩霖;吕建鑫;张亚男;;乳腺癌侵袭相关分子的研究热点[J];东南大学学报(医学版);2018年04期

9 童彤;;草莓能抑制乳腺癌扩散[J];中国果业信息;2017年05期

10 陈畅;黄欣;茅枫;周易冬;林燕;孙强;;乳腺癌眼部转移的诊治现状[J];中华乳腺病杂志(电子版);2018年05期

相关会议论文 前10条

1 钱明;黄剑浜;肖杨;郑海荣;;利用高频超声刺激探究乳腺癌细胞侵袭性[A];2016年全国声学学术会议论文集[C];2016年

2 杨永长;黄文芳;刘华;肖代雯;姜伟;;乳腺癌细胞核差异蛋白筛选[A];中华医学会第七次全国中青年检验医学学术会议论文汇编[C];2012年

3 陆劲松;邵志敏;吴炅;韩企夏;沈镇宙;;新型维甲酸抑制乳腺癌细胞的生长及诱导凋亡的机制研究[A];2000全国肿瘤学术大会论文集[C];2000年

4 白霞;傅建新;丁凯阳;王兆钺;阮长耿;;组织因子途径抑制物-2在乳腺癌细胞中的表达研究[A];第10届全国实验血液学会议论文摘要汇编[C];2005年

5 戴建建;章静茹;陈峰;马道新;纪春岩;;EGFR抑制剂对乳腺癌细胞生物学活性的影响[A];中华医学会血液学分会第十三届全国血栓与止血学术会议暨“血栓栓塞性疾病(血栓与止血)基础与临床研究进展”论文摘要汇编及学习班讲义[C];2011年

6 李俊;缪苏宇;李晓敏;束永前;王水;殷咏梅;;肿瘤坏死因子-α对乳腺癌细胞CD44表达的调控以及影响细胞迁徙的机制探讨[A];2010’全国肿瘤分子标志及应用学术研讨会暨第五届中国中青年肿瘤专家论坛论文汇编[C];2010年

7 ;不同分子量肝素对乳腺癌细胞侵袭和转移能力的影响(英文)[A];第十一届全国青年药学工作者最新科研成果交流会论文集[C];2012年

8 汲振余;李懿;范丹丹;;膜骨架蛋白4.1N负调控乳腺癌细胞的粘附、迁移及侵袭[A];2013医学前沿论坛暨第十三届全国肿瘤药理与化疗学术会议论文集[C];2013年

9 赵丽;曹英林;;降钙素体外抑制乳腺癌细胞的作用[A];中国免疫学会第四届学术大会会议议程及论文摘要集[C];2002年

10 赵丽;曹英林;;降钙素体外抑制乳腺癌细胞的作用[A];中国免疫学会第四届学术大会会议议程及论文摘要集[C];2002年

相关重要报纸文章 前10条

1 记者 闫洁;我学者发现乳腺癌侵袭转移新机制[N];中国科学报;2012年

2 本报记者 黄辛 通讯员 王广兆;最“毒”乳腺癌开启精准治疗时代[N];中国科学报;2019年

3 记者 张梦然;妊娠34周以上可降低乳腺癌风险[N];科技日报;2018年

4 记者 张梦然;转移乳腺癌细胞休眠不死之谜破解[N];科技日报;2018年

5 本报记者 刘霞;大数据算法在诸多领域“弄潮”[N];科技日报;2017年

6 南方日报记者 严慧芳 通讯员 宋莉萍;长期喝蜂王浆会致癌?[N];南方日报;2017年

7 记者 毛黎;美发现有效抑制乳腺癌细胞生长的分子[N];科技日报;2010年

8 ;专家发现抑制DNA修补可杀死乳腺癌细胞[N];中国高新技术产业导报;2005年

9 记者 毛磊;乳腺癌干细胞被美专家发现[N];新华每日电讯;2003年

10 记者 宋心德;圆白菜、胡萝卜能防乳腺癌[N];新华每日电讯;2004年

相关博士学位论文 前10条

1 李志华;miR-29a参与胰岛素信号通路调控乳腺癌生长侵袭的分子机制[D];南昌大学;2016年

2 范姝琳;长链非编码RNA TUG1影响乳腺癌细胞增殖、迁移及侵袭的研究[D];吉林大学;2018年

3 林冬静;CLDN6在乳腺癌组织中的表达及其诱导乳腺癌细胞自噬的作用[D];吉林大学;2018年

4 马振海;miR-199b-5p和miR-409-3p在乳腺癌发生发展中的作用及其调控机制研究[D];大连医科大学;2016年

5 蔡琳琳;柴桂龙牡汤改善Luminal型乳腺癌患者生活质量及对MCF-7细胞株影响的研究[D];中国中医科学院;2018年

6 赵建华;MRI动态增强联合钼靶在乳腺癌早期诊治临床路径中的价值研究[D];南方医科大学;2017年

7 李俊堂;miR-568抑制乳腺癌细胞体内外转移机制的研究[D];第四军医大学;2014年

8 张懿敏;葡萄糖对乳腺癌细胞内质网应激及增殖转移能力的影响及其调节机制[D];武汉大学;2015年

9 周云;长链非编码基因HOTAIR对乳腺癌放射抵抗性的调控及机制[D];南京医科大学;2016年

10 燕小梅;乳腺癌中岩藻糖基转移酶Ⅳ的表达、检测及影响因素的研究[D];大连医科大学;2016年

相关硕士学位论文 前10条

1 韩雪;乳腺癌中雄激素受体的表达及其与临床病理特征的关系[D];大连医科大学;2013年

2 张开炯;循环lncRNA H19对乳腺癌的诊断价值及其遗传易感性研究[D];西南医科大学;2016年

3 柯子瑞;乳腺癌中Rab22a的表达与生存预后的关系[D];吉林大学;2018年

4 尤文婷;miR-491-5p在ERα阳性乳腺癌细胞中的功能研究[D];华中科技大学;2017年

5 王远涛;维生素K2诱导乳腺癌MCF-7细胞凋亡的研究[D];华中科技大学;2017年

6 曹换换;基于基因表达谱和蛋白-蛋白相互作用网络的乳腺癌相关特异性基因的识别[D];天津大学;2018年

7 武晋玲;乳腺癌靶向多肽的筛选和初步鉴定[D];陕西师范大学;2015年

8 曾艺秀;基于荧光相关光谱技术的乳腺癌细胞膜微区特性研究[D];福建师范大学;2015年

9 张瑞;新型透明质酸基因传递载体的优化及其介导的乳腺癌靶向基因沉默[D];郑州大学;2018年

10 刘美佳;三种内酯类化合物对乳腺癌细胞MCF-7的抑制作用及机制研究[D];辽宁大学;2018年



本文编号:2787172

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/2787172.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5ba80***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com