基于共改变网络的乳腺癌基因识别算法研究
发布时间:2022-12-07 19:55
乳腺癌是一种恶性肿瘤,其对于女性健康的威胁程度逐年升高,并且发病率在女性中具有年轻化趋势,尤其在我国,其发病率上升趋势较为明显。针对乳腺癌致病基因的预测是当今时代亟待解决的重大问题。目前对于乳腺癌致病基因的分析多从基因单特征入手,已不能满足当今的时代需求,为增加基因识别的准确性,本文利用乳腺癌三方面特征数据,包括:乳腺癌拷贝数、甲基化、基因表达数据,优先筛选其单一层面差异基因,进而构建乳腺癌基因共改变网络,增加基因间的相互作用关系,以预测乳腺癌相关癌症基因。本文主要完成以下几方面工作:首先,对于乳腺癌基因组学数据的获取及处理。包括:基因拷贝数数据、甲基化数据、基因表达数据、蛋白质互作数据及临床信息数据。其次,对乳腺癌单一特征,即基因表达特征、拷贝数特征、甲基化特征分别进行分析,提取其中的差异基因,为后续的基因联合分析奠定基础。然后,整合基因三方面特征数据进行联合分析。利用蛋白质互作数据构建人类蛋白质互作网络,作为实验的基础网络。利用乳腺癌基因数据筛选出蛋白质互作网络中与乳腺癌基因相关的节点,通过典型相关分析算法,计算基因间的相关系数,作为权值赋给对应的边,以构建乳腺癌基因共改变网络。最...
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 基因表达研究
1.2.2 拷贝数变异研究
1.2.3 DNA甲基化研究
1.2.4 乳腺癌基因识别
1.3 主要研究内容
第2章 乳腺癌多组学数据
2.1 多组学数据
2.2 数据来源
2.2.1 TCGA数据库
2.2.2 其它数据来源
2.3 数据获取
2.3.1 乳腺癌拷贝数数据获取
2.3.2 乳腺癌基因表达数据获取
2.3.3 乳腺癌甲基化数据获取
2.3.4 蛋白质互作数据获取
2.3.5 乳腺癌癌症基因数据获取
2.4 本章小结
第3章 基于单一特征的差异基因提取
3.1 数据预处理
3.2 乳腺癌基因在单一水平的差异分析
3.2.1 拷贝数变异筛选
3.2.2 甲基化变异筛选
3.2.3 基因表达变异筛选
3.3 结合多方影响因素识别乳腺癌差异基因
3.3.1 拷贝数与基因表达关联分析
3.3.2 甲基化与基因表达关联分析
3.4 本章小结
第4章 基于共改变网络的乳腺癌基因识别
4.1 乳腺癌基因共改变网络的构建
4.1.1 乳腺癌差异基因提取
4.1.2 利用典型相关算法计算相关系数
4.1.3 共改变网络构建
4.2 基于共改变网络识别乳腺癌差异基因
4.2.1 随机游走算法
4.2.2 利用重启的随机游走算法识别乳腺癌相关基因
4.3 本章小结
第5章 实验与结果分析
5.1 实验算例
5.2 实验结果分析
5.2.1 生存分析
5.2.2 GO富集分析
5.3 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢
【参考文献】:
期刊论文
[1]乳腺癌患者血清BRMS1mRNA的表达及意义分析[J]. 史源,胡建民. 临床研究. 2019(11)
[2]外周血USP1基因甲基化与大肠癌预后风险的关系[J]. 张谊微,石晶,刘宇鹏,曹丽明,胡付兰,赵亚双. 实用肿瘤学杂志. 2019(05)
[3]基于多组学数据识别癌症驱动通路的模型和算法[J]. 蔡齐荣,吴璟莉. 计算机科学. 2019(09)
[4]丙肝患者血清HCV RNA拷贝数与HCV Ab定量和肝脏功能损伤程度的关系[J]. 许媛,付浩,谭军,陈莹,郑阳,钟晓武,李九龙,苟海梅,邓健康,王东生,刘素兰,方莉. 中国热带医学. 2019(08)
[5]TP63基因启动子DNA甲基化与宫颈癌的相关性研究[J]. 郑雪,马冬,赵俊谏,熊艳杰,李萌,李鸥. 现代妇产科进展. 2019(12)
[6]APOBEC3基因拷贝数变异与乳腺癌易感性的关联[J]. 姜鑫钊,张明龙,杜媛媛,李芙蓉,赵大龙,马洪星,黎碧达,张洋,李石,郑立红. 基因组学与应用生物学. 2019(03)
[7]PD-1/PD-L1在非特殊型浸润性乳腺癌中的表达及意义[J]. 李莹莹,董丽儒,李宇阳,熊艳杰,宋旭东. 广东医学. 2018(11)
[8]Six1基因启动子未甲基化在宫颈癌病情及预后评估中的价值[J]. 李胜华,洛若愚. 癌症进展. 2016(08)
[9]胃癌组织中ERCC1基因的高甲基化及DNMT1的表达[J]. 张杰,张梅,姜相君. 胃肠病学和肝病学杂志. 2016(06)
[10]整合分析基因表达与拷贝数变异识别癌症的驱动基因及调控子miRNAs[J]. 许艳,张淑娟,常志强,张善镇,尚德思. 现代生物医学进展. 2016(05)
博士论文
[1]肺癌组织中p16基因mRNA和蛋白表达及基因异常甲基化的研究[D]. 张军航.中国医科大学 2002
硕士论文
[1]基于乳腺癌基因组数据的分析与可视化平台实现[D]. 邹杰民.湖南大学 2017
[2]单双侧原发性乳腺癌HER-2基因扩增差异及与临床预后关系分析[D]. 董赟.南昌大学 2016
[3]肺癌组织中Fas蛋白、Fas mRNA表达与Fas基因甲基化的相关性分析[D]. 朱一霏.苏州大学 2011
本文编号:3712740
【文章页数】:65 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 基因表达研究
1.2.2 拷贝数变异研究
1.2.3 DNA甲基化研究
1.2.4 乳腺癌基因识别
1.3 主要研究内容
第2章 乳腺癌多组学数据
2.1 多组学数据
2.2 数据来源
2.2.1 TCGA数据库
2.2.2 其它数据来源
2.3 数据获取
2.3.1 乳腺癌拷贝数数据获取
2.3.2 乳腺癌基因表达数据获取
2.3.3 乳腺癌甲基化数据获取
2.3.4 蛋白质互作数据获取
2.3.5 乳腺癌癌症基因数据获取
2.4 本章小结
第3章 基于单一特征的差异基因提取
3.1 数据预处理
3.2 乳腺癌基因在单一水平的差异分析
3.2.1 拷贝数变异筛选
3.2.2 甲基化变异筛选
3.2.3 基因表达变异筛选
3.3 结合多方影响因素识别乳腺癌差异基因
3.3.1 拷贝数与基因表达关联分析
3.3.2 甲基化与基因表达关联分析
3.4 本章小结
第4章 基于共改变网络的乳腺癌基因识别
4.1 乳腺癌基因共改变网络的构建
4.1.1 乳腺癌差异基因提取
4.1.2 利用典型相关算法计算相关系数
4.1.3 共改变网络构建
4.2 基于共改变网络识别乳腺癌差异基因
4.2.1 随机游走算法
4.2.2 利用重启的随机游走算法识别乳腺癌相关基因
4.3 本章小结
第5章 实验与结果分析
5.1 实验算例
5.2 实验结果分析
5.2.1 生存分析
5.2.2 GO富集分析
5.3 本章小结
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢
【参考文献】:
期刊论文
[1]乳腺癌患者血清BRMS1mRNA的表达及意义分析[J]. 史源,胡建民. 临床研究. 2019(11)
[2]外周血USP1基因甲基化与大肠癌预后风险的关系[J]. 张谊微,石晶,刘宇鹏,曹丽明,胡付兰,赵亚双. 实用肿瘤学杂志. 2019(05)
[3]基于多组学数据识别癌症驱动通路的模型和算法[J]. 蔡齐荣,吴璟莉. 计算机科学. 2019(09)
[4]丙肝患者血清HCV RNA拷贝数与HCV Ab定量和肝脏功能损伤程度的关系[J]. 许媛,付浩,谭军,陈莹,郑阳,钟晓武,李九龙,苟海梅,邓健康,王东生,刘素兰,方莉. 中国热带医学. 2019(08)
[5]TP63基因启动子DNA甲基化与宫颈癌的相关性研究[J]. 郑雪,马冬,赵俊谏,熊艳杰,李萌,李鸥. 现代妇产科进展. 2019(12)
[6]APOBEC3基因拷贝数变异与乳腺癌易感性的关联[J]. 姜鑫钊,张明龙,杜媛媛,李芙蓉,赵大龙,马洪星,黎碧达,张洋,李石,郑立红. 基因组学与应用生物学. 2019(03)
[7]PD-1/PD-L1在非特殊型浸润性乳腺癌中的表达及意义[J]. 李莹莹,董丽儒,李宇阳,熊艳杰,宋旭东. 广东医学. 2018(11)
[8]Six1基因启动子未甲基化在宫颈癌病情及预后评估中的价值[J]. 李胜华,洛若愚. 癌症进展. 2016(08)
[9]胃癌组织中ERCC1基因的高甲基化及DNMT1的表达[J]. 张杰,张梅,姜相君. 胃肠病学和肝病学杂志. 2016(06)
[10]整合分析基因表达与拷贝数变异识别癌症的驱动基因及调控子miRNAs[J]. 许艳,张淑娟,常志强,张善镇,尚德思. 现代生物医学进展. 2016(05)
博士论文
[1]肺癌组织中p16基因mRNA和蛋白表达及基因异常甲基化的研究[D]. 张军航.中国医科大学 2002
硕士论文
[1]基于乳腺癌基因组数据的分析与可视化平台实现[D]. 邹杰民.湖南大学 2017
[2]单双侧原发性乳腺癌HER-2基因扩增差异及与临床预后关系分析[D]. 董赟.南昌大学 2016
[3]肺癌组织中Fas蛋白、Fas mRNA表达与Fas基因甲基化的相关性分析[D]. 朱一霏.苏州大学 2011
本文编号:3712740
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3712740.html
最近更新
教材专著