基于拟合回归的癌症代谢分析和基因间相关性研究
发布时间:2020-06-19 03:40
【摘要】:拟合回归是一类用于分析和确定多种变量之间定量相互依赖关系的算法模型。作为被广泛使用的数据挖掘方法,它的应用极大地推动了以生物信息学为代表的众多学科的深入发展。本文使用、设计并实现基于拟合回归的算法模型,用于分析生物组学数据,进而回答生物信息学问题。论文的主要工作集中在谷氨酰胺和谷氨酸在多种癌症中的代谢分析和基于拟合回归模型的基因间相关性研究两方面。在第一部分主要研究工作中,本文使用11种癌症和对照正常组织的转录组学数据研究谷氨酰胺和谷氨酸在癌症组织中的代谢异常,相较于仅使用细胞系实验和动物模型数据,其结果更能够如实地反映这两种氨基酸代谢在人体癌症组织中的真实情况;采用多元多重线性回归模型,用于计算每种癌症组织中谷氨酰胺/谷氨酸参与7种合成代谢过程中产物合成的程度及其统计显著性,在国内外众多研究工作中,首次对多种类型癌症组织中谷氨酰胺/谷氨酸参与生物过程水平进行了横向的比较。经过分析,对谷氨酰胺和谷氨酸在癌症组织中参与生物过程的情况有了全新的认识,发现这两种氨基酸在不同的癌症组织中参与7种合成代谢过程的程度存在显著异常,尤其是其中谷氨酰胺和谷氨酸参与某些合成过程显著增强可以作为新的癌症代谢特征,为以谷氨酰胺和谷氨酸代谢为靶点的癌症治疗手段提供新思路与理论依据。在第二部分主要研究工作中,本文设计并实现基于拟合回归的多特征相似性(MFR)模型,联合使用两类异构基因对特征:共表达相似性和先验知识相似性,综合考量两种评分标准:共表达相关性和先验知识相关性,用于更准确地衡量特定实验条件下的基因间相关性,避免使用单一类型基因对特征和单一评分标准的不足;使用支持向量机为核心构建MFR模型,实现多目标优化,并保证模型具有较好的泛化能力;针对使用支持向量机这一广义线性逻辑回归模型为核心构建模型用于衡量连续数值的基因间相关性问题,使用基因对样本属于正/负样本集合的“概率”,即基因对样本距离支持向量机最终分类面的距离的归一化数值作为衡量特定实验条件下基因间相关性的新指标——MFR。实验结果表明,新模型相较于其它经典多特征线性模型和共表达分析算法,具有更好的准确性、鲁棒性和应用性。MFR模型脚本已经由R语言实现并公布在MFR模型网站首页用于自由下载和学术研究。本文的两部分主要研究工作不仅都是基于拟合回归的思想,而且恰好分别是拟合回归两种主要用途在具体生物信息学问题中的实际应用,并计划在未来的研究工作中进一步结合,其研究成果具有现实意义。
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP311.13;R73
【图文】:
图 1.1 癌症特征图 1.2 2005 年和 2015 年中造成人类死亡的 9 种主要原因在全球的死亡率本文的第一部分主要研究工作是拟发现新的可以作为癌症特征的代谢改变,主要聚
2图 1.2 2005 年和 2015 年中造成人类死亡的 9 种主要原因在全球的死亡率本文的第一部分主要研究工作是拟发现新的可以作为癌症特征的代谢改变,主要聚焦在氨基酸代谢,特别是谷氨酰胺和谷氨酸代谢。在以往的国内外研究中,大量的实验据表明:谷氨酰胺是人体血液循环中含量最高的自由氨基酸[18][19];与正常或者癌旁组织相比,肿瘤细胞摄入谷氨酰胺能力显著增强,谷氨酰胺的跨膜转运蛋白基因 SLC1A5 和SLC38A1 在多种癌症,例如:乳腺癌[20]、肠癌[21]、肺癌[22]中高表达;此外在多种癌症的不同生物过程中谷氨酰胺都发挥着重要的作用[23]。其中谷氨酰胺主要参与的生物过程包括:参与合成蛋白质和核苷酸[24];在瓦伯格效应(Warburg effect)下,水解成为谷氨酸进入三羧酸循环,为肿瘤细胞的生长合成必要的代谢产物[25][26],例如:能量、脂肪等
本文编号:2720250
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP311.13;R73
【图文】:
图 1.1 癌症特征图 1.2 2005 年和 2015 年中造成人类死亡的 9 种主要原因在全球的死亡率本文的第一部分主要研究工作是拟发现新的可以作为癌症特征的代谢改变,主要聚
2图 1.2 2005 年和 2015 年中造成人类死亡的 9 种主要原因在全球的死亡率本文的第一部分主要研究工作是拟发现新的可以作为癌症特征的代谢改变,主要聚焦在氨基酸代谢,特别是谷氨酰胺和谷氨酸代谢。在以往的国内外研究中,大量的实验据表明:谷氨酰胺是人体血液循环中含量最高的自由氨基酸[18][19];与正常或者癌旁组织相比,肿瘤细胞摄入谷氨酰胺能力显著增强,谷氨酰胺的跨膜转运蛋白基因 SLC1A5 和SLC38A1 在多种癌症,例如:乳腺癌[20]、肠癌[21]、肺癌[22]中高表达;此外在多种癌症的不同生物过程中谷氨酰胺都发挥着重要的作用[23]。其中谷氨酰胺主要参与的生物过程包括:参与合成蛋白质和核苷酸[24];在瓦伯格效应(Warburg effect)下,水解成为谷氨酸进入三羧酸循环,为肿瘤细胞的生长合成必要的代谢产物[25][26],例如:能量、脂肪等
【相似文献】
相关期刊论文 前3条
1 闫常陆;王峰;;基于萨道夫斯基公式拟合的爆破振动规律研究[J];现代矿业;2018年06期
2 吕纯濂;用QR分解拟合回归方程参数估计和剩余的迭代加细[J];数值计算与计算机应用;2000年04期
3 仝宇;;基于径向基网络动态称量数据修正[J];山西电子技术;2015年01期
相关会议论文 前1条
1 张明;姬光刚;潘林;;科学冶炼精益管理模式的应用和探索[A];2017年全国高炉炼铁学术年会论文集(上)[C];2017年
相关博士学位论文 前1条
1 田原;基于拟合回归的癌症代谢分析和基因间相关性研究[D];吉林大学;2018年
相关硕士学位论文 前1条
1 张瑞琼;改善厚板滚切式双边剪剪切质量的研究[D];燕山大学;2009年
本文编号:2720250
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/2720250.html
最近更新
教材专著