基于重复信息测定与卷积神经网络的蛋白质亚细胞定位研究
发布时间:2024-06-28 00:03
细胞由细胞膜、细胞核、内质网等被称为“亚细胞”的各部分组成,亚细胞的功能由位于其中的蛋白质执行。蛋白质的亚细胞结构被叫做蛋白质的“亚细胞位置”。蛋白质必须被运送到适当的亚细胞位置才能正常发挥功能,否则会产生机体功能紊乱和疾病,因而准确的了解亚细胞定位信息对于深入了解蛋白质的功能、细胞生命活动等具有重要意义。同时,蛋白质数据本身的海量、多模态、关联性、不完整等特征,使蛋白质亚细胞定位问题成为生物信息学领域具有挑战性的研究热点。蛋白质亚细胞定位问题一般分为三个步骤,分别为特征提取、分类预测和算法评估。特征提取是最关键的一步。通过对蛋白质序列进行分析,提取主要特征,建立特征向量;分类预测是将特征提取的特征作为分类算法的输入送到不同的分类器中;算法评估是评估分类结果,判定特征提取方法和分类算法的优劣。本文围绕蛋白质亚细胞定位问题,主要进行特征提取方法和分类算法两个方面的研究。论文工作如下:(1)针对传统特征提取方法上的不足,本文提出三种新的基于重复信息测定的特征提取方法,分别为R-Dipeptide、I-PseAAC、PseAAC2。其中,R-Dipeptide通过窗口移动测定关键信息,并通过...
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
本文编号:3996140
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
图1.1细胞结构
第一章绪论研究背景及意义胞是由溶酶体、内质网、核糖体等诸多“亚细胞结构”构成的生命体的基如图1.1所示。有机体绝大多数生命活动,如生长、发育、生殖、遗传、代细胞及亚细胞水平,都由蛋白质作为主要承担者来完成。蛋白质是所有细成分,参与DNA的转录翻译过程、细胞的信号传导过....
图2.2系统化生物信息学生物信息学主要包括以下几方面的研究内容,如生物信息学数据库的建立与使用、同源性序列的查找与对比分析、蛋白质结构方面的分析、非编码区方面的分析、系统发
图4.1支持向量机结构图
基于重复信息测定与卷积神经网络的蛋白质亚细胞定位研究持向量机的存在是为了解决非线性可分问题。当样本A与样本B两类样分时,则可以通过支持向量机算法将两类样本的特征向量映射到高维从而征向量的方式加以处理,若样本A与样本B两类样本在映射后的高维空间即支持向量机执行的大体....
图4.2神经元结构图
图4.2神经元结构图P神经网络为各类神经网络算法的基础且由于其具备可靠的理论依据与严,因而被广泛使用。不过BP神经网络虽被广泛使用却不免存在不足之处现很多改进算法,如带有动量项的改进BP、带有自适应学习率的改进BP适应率相结合的改进BP、L-M学习规则等等分别针....
本文编号:3996140
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3996140.html
上一篇:不确定混沌系统的自适应网络同步与混沌多智能体系统一致性
下一篇:没有了
下一篇:没有了