基于多尺度单演信号解析和深度学习的人类蛋白质图像亚细胞位置预测研究
发布时间:2021-09-04 05:22
蛋白质需要在正确的时间出现在正确的亚细胞位置,并与相应的分子结合才能正确行使它们的功能。因此,准确的获取蛋白质亚细胞位置对于理解蛋白质的功能、癌症靶向药研发以及癌症标记物的筛选起着不可替代的作用。早期对于蛋白质亚细胞位置的获取是采用传统的生物分子学实验得到蛋白质数据,研究人员再根据实验数据进行亚细胞位置标注。但是,此方法消耗了大量的人力、资金和时间。因此,基于已有的海量生物数据和模式识别与机器学习理论,研究人员致力于开发自动的亚细胞位置预测模型。尽管现有的预测模型对于人类、动物和植物蛋白质的亚细胞位置预测取得了令人鼓舞的效果,但是这些预测模型几乎是基于蛋白质序列数据,这导致无法准确捕获蛋白质在不同生化环境中的表达和分布变化,例如:当目标蛋白质所在人体组织发生癌变时。相反,蛋白质图像可以准确直观的反映蛋白质在人体组织中的表达情况,例如:组织的纹理分布、轮廓、边缘和颜色信息,使的基于蛋白质图像数据的预测模型能够精确捕获蛋白质在正常与癌症人体组织中的分布模式,从而高效的完成癌症标记物的筛选和临床医学试验。因此,本文采用了蛋白质图像数据作为研究对象,通过挖掘蛋白质图像的频域信息以及采用深度学习...
【文章来源】:江西科技师范大学江西省
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
在人类正常以及癌症组织中,蛋白质图片和蛋白质序列的对比
第1章绪论9图1-2本文结构简述本文的具体结构安排如下:第一章主要介绍了精确预测蛋白质图像亚细胞位置的研究意义和本文所做的主要工作。第二章主要介绍了蛋白质和亚细胞位置的基本知识以及蛋白质图像领域内常用的特征提取方法。第三章主要介绍了本研究中提出的基于单演多尺度解析信号和图像强度编码的多标记蛋白质图像亚细胞位置预测模型MIC_Locator。第四章主要介绍了本文中提出的基于注意力机制和残差网络的预测模型AR_Locator。第五章总结与展望。
第2章背景知识介绍10第2章基础知识简述在后基因时代,尽管大量的蛋白质序列可以被研究人员通过测序技术获得,但是序列信息仍然无法直观的刻画蛋白质在不同组织生理环境中的表达和分布情况,例如:蛋白质在正常和癌症组织中。随着电子显微镜的快速发展,研究人员尝试通过电子显微镜对蛋白质在组织和细胞中直接进行观测,海量的蛋白质图像被获得。由于蛋白质图像可以极大的反映蛋白质在组织及细胞中的分布以及表达,在癌症标记物筛查、癌症临床诊断和靶向药的研发中蛋白质图像均被大量的使用。海量的蛋白质图像数据,导致以往通过专家做生物实验来获取蛋白质亚细胞位置的方法越来越无法适应数据的增长。因此,国内外大量的研究人员开始尝试使用模式识别与机器学习的方法来构建亚细胞位置预测模型,从而自动的对蛋白质图像的亚细胞位置进行分类及预测。从机器学习的角度,自动化的预测模型构建过程主要分为以下4个步骤:(1)收集和整理基准数据集。(2)高效的图像特征提取方法。(3)分类器的建立。(4)预测模型性能的评估。本章主要介绍蛋白质、亚细胞位置、蛋白质图像和常用的蛋白质图像数据库相关知识。2.1蛋白质基础知识细胞是人体构成的基本单位,人体的一切生命活动都离不开细胞的参与。在细胞中,有无数个蛋白质分子,它们是生命活动的主要承担者[65]。蛋白质是生物大分子,由一个或多个氨基酸组成[66]。蛋白质主要的功能包括:代谢反应的催化、DNA的复制和转移生物分子等等。蛋白质之间的主要差异是由氨基酸序列所决定,这导致蛋白质具有不同的结构和组成成分,从而导致其功能各异。图2-1氨基酸结构通式示意图尽管蛋白质的结构和功能各不相同,但是蛋白质都是由氨基酸通过脱水缩
【参考文献】:
期刊论文
[1]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[2]生物信息学在药物研究和开发中的应用[J]. 王可鉴,贺林,杨仑. 中国药理学与毒理学杂志. 2014(01)
[3]当前生物信息学的重要研究任务[J]. 陈润生. 生物工程进展. 1999(04)
[4]细胞:生命活动的基本单位[J]. 丁小燕. 科学. 1998(04)
本文编号:3382646
【文章来源】:江西科技师范大学江西省
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
在人类正常以及癌症组织中,蛋白质图片和蛋白质序列的对比
第1章绪论9图1-2本文结构简述本文的具体结构安排如下:第一章主要介绍了精确预测蛋白质图像亚细胞位置的研究意义和本文所做的主要工作。第二章主要介绍了蛋白质和亚细胞位置的基本知识以及蛋白质图像领域内常用的特征提取方法。第三章主要介绍了本研究中提出的基于单演多尺度解析信号和图像强度编码的多标记蛋白质图像亚细胞位置预测模型MIC_Locator。第四章主要介绍了本文中提出的基于注意力机制和残差网络的预测模型AR_Locator。第五章总结与展望。
第2章背景知识介绍10第2章基础知识简述在后基因时代,尽管大量的蛋白质序列可以被研究人员通过测序技术获得,但是序列信息仍然无法直观的刻画蛋白质在不同组织生理环境中的表达和分布情况,例如:蛋白质在正常和癌症组织中。随着电子显微镜的快速发展,研究人员尝试通过电子显微镜对蛋白质在组织和细胞中直接进行观测,海量的蛋白质图像被获得。由于蛋白质图像可以极大的反映蛋白质在组织及细胞中的分布以及表达,在癌症标记物筛查、癌症临床诊断和靶向药的研发中蛋白质图像均被大量的使用。海量的蛋白质图像数据,导致以往通过专家做生物实验来获取蛋白质亚细胞位置的方法越来越无法适应数据的增长。因此,国内外大量的研究人员开始尝试使用模式识别与机器学习的方法来构建亚细胞位置预测模型,从而自动的对蛋白质图像的亚细胞位置进行分类及预测。从机器学习的角度,自动化的预测模型构建过程主要分为以下4个步骤:(1)收集和整理基准数据集。(2)高效的图像特征提取方法。(3)分类器的建立。(4)预测模型性能的评估。本章主要介绍蛋白质、亚细胞位置、蛋白质图像和常用的蛋白质图像数据库相关知识。2.1蛋白质基础知识细胞是人体构成的基本单位,人体的一切生命活动都离不开细胞的参与。在细胞中,有无数个蛋白质分子,它们是生命活动的主要承担者[65]。蛋白质是生物大分子,由一个或多个氨基酸组成[66]。蛋白质主要的功能包括:代谢反应的催化、DNA的复制和转移生物分子等等。蛋白质之间的主要差异是由氨基酸序列所决定,这导致蛋白质具有不同的结构和组成成分,从而导致其功能各异。图2-1氨基酸结构通式示意图尽管蛋白质的结构和功能各不相同,但是蛋白质都是由氨基酸通过脱水缩
【参考文献】:
期刊论文
[1]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[2]生物信息学在药物研究和开发中的应用[J]. 王可鉴,贺林,杨仑. 中国药理学与毒理学杂志. 2014(01)
[3]当前生物信息学的重要研究任务[J]. 陈润生. 生物工程进展. 1999(04)
[4]细胞:生命活动的基本单位[J]. 丁小燕. 科学. 1998(04)
本文编号:3382646
本文链接:https://www.wllwen.com/projectlw/swxlw/3382646.html
教材专著