基于稀疏表示的蛋白质相互作用预测及应用
发布时间:2021-04-01 10:52
蛋白质作为生命体的基础物质之一,其功能发挥对于各种生命活动如新陈代谢、激素调节、细胞活动和酶的催化反应等都起到关键性的作用。因此,蛋白质相互作用研究不仅有利于了解生命运行机制,而且对于新药研发等方面都具有重要意义。然而,采用传统生物实验方法鉴定蛋白质之间的相互作用不仅成本高昂,而且还存在着较高的假阳性和假阴性率。随着信息技术的快速发展,采用智能计算的方法对蛋白质相互作用进行预测不仅速度快,而且准确率高,已成为预测蛋白质相互作用重要手段。本文的主要工作如下:(1)基于矩阵的特征提取方法选择。为了高效且全面地提取到蛋白质序列中重要的特征向量矩阵,本文分别使用了矩阵主成分分析和矩阵线性判别分析方法对经过数值化表示后的蛋白质序列信息进行特征提取。通过在H.pylori、S.cerevisiae和Human数据集上与其它特征提取方法的实验对比,证明了本文提出特征提取方法的有效性。(2)基于稀疏表示的预测模型设计。本文分别采用了稀疏表示模型和加权稀疏表示模型来实现蛋白质相互作用预测的功能。通过与支持向量机和其它模型的对比实验,发现基于稀疏表示的模型能够很好的与本文使用的特征提取方法相结合,并具有优...
【文章来源】:西京学院陕西省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
蛋白质序列特征提取流程图
近些年来随着计算机视觉领域的发展,稀疏表示不仅应用于信号处理领域在图像修复、模式识别、目标追踪和图像分类等诸多领域也得到了广泛应用中,首先介绍了稀疏表示模型的基本理论,其次以 K-SVD 字典学习方法为例了稀疏表示模型中的字典学习过程,并简要概述了稀疏表示模型在蛋白质相预测中的实际应用。.1 稀疏表示如下图 2.2 所示,假设样本 X 表示 M×N 大小的矩阵表示,其中每一行代 X 中的每一行向量,每一列代表矩阵 X 中的每一个列向量,一般而言,该矩稠密的,即大多数元素不为 0。稀疏表示的含义是寻找一个稀疏系数矩阵 (以及一个字典矩阵 D(M×K),使得 D× 尽可能的还原矩阵 X,该矩阵可能的稀疏,即大多数元素都为 0,则矩阵 便是矩阵 X 的稀疏表示。目前听到的压缩感知技术就是来自稀疏表示的思想,只不过它是稀疏表示的逆,并且压缩感知的前提是样本要具有一定稀疏性。
具体的匹配追踪方法流程图如下图 2.3所示。图 2. 3 匹配追踪方法流程图2.3.2 字典学习采用以上方法只是获取了稀疏系数的矩阵,也就是说字典 D 矩阵是固定不变的,这样一来训练出的模型自适应能力较差,泛化能力也较低,为了弥补这方面的不足,Michal Aharon 等人提出了一种用于字典学习的 KSVD 方法[35],此方法能够根据不同训练样本自适应的构造出新的字典 D’。其 KSVD 名字的由来是该方法要经过
【参考文献】:
期刊论文
[1]多重耐药铜绿假单胞菌的两种同源性分析方法的比较[J]. 李进,胡韦维,张峰领,黎敏,陈鸣,邓少丽,鲁卫平. 第三军医大学学报. 2018(14)
[2]转录组学和蛋白质组学关联分析在植物研究中的应用[J]. 王晓丹,肖钢,张振乾,肖楠,陈浩,官春云. 基因组学与应用生物学. 2018(01)
[3]‘春甜橘’及其突变体果皮差异相关蛋白质组分析[J]. 曾继吾,邓贵明,高长玉,姜波,钟云,钟广炎,易干军. 中国农业科学. 2015(24)
[4]基于物理化学性质优化的蛋白质相互作用预测研究[J]. 倪青山,王正志,赵英杰,黎刚果. 生命科学研究. 2009(03)
[5]基于氨基酸序列预测蛋白质功能性点突变位点[J]. 宋卓,张宁,阮吉寿,杨卓,张涛. 生物物理学报. 2007(02)
[6]酵母基因上游与内含子可能存在的转录协同作用[J]. 张昆林,张静,罗静初. 生物化学与生物物理进展. 2005(01)
[7]植物F-box蛋白质及其研究进展[J]. 王洪云,黄剑,赖钊,薛勇彪. 科学通报. 2002(12)
硕士论文
[1]几类重要蛋白—蛋白相互作用的分子模拟[D]. 昝金行.北京协和医学院 2012
本文编号:3113216
【文章来源】:西京学院陕西省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
蛋白质序列特征提取流程图
近些年来随着计算机视觉领域的发展,稀疏表示不仅应用于信号处理领域在图像修复、模式识别、目标追踪和图像分类等诸多领域也得到了广泛应用中,首先介绍了稀疏表示模型的基本理论,其次以 K-SVD 字典学习方法为例了稀疏表示模型中的字典学习过程,并简要概述了稀疏表示模型在蛋白质相预测中的实际应用。.1 稀疏表示如下图 2.2 所示,假设样本 X 表示 M×N 大小的矩阵表示,其中每一行代 X 中的每一行向量,每一列代表矩阵 X 中的每一个列向量,一般而言,该矩稠密的,即大多数元素不为 0。稀疏表示的含义是寻找一个稀疏系数矩阵 (以及一个字典矩阵 D(M×K),使得 D× 尽可能的还原矩阵 X,该矩阵可能的稀疏,即大多数元素都为 0,则矩阵 便是矩阵 X 的稀疏表示。目前听到的压缩感知技术就是来自稀疏表示的思想,只不过它是稀疏表示的逆,并且压缩感知的前提是样本要具有一定稀疏性。
具体的匹配追踪方法流程图如下图 2.3所示。图 2. 3 匹配追踪方法流程图2.3.2 字典学习采用以上方法只是获取了稀疏系数的矩阵,也就是说字典 D 矩阵是固定不变的,这样一来训练出的模型自适应能力较差,泛化能力也较低,为了弥补这方面的不足,Michal Aharon 等人提出了一种用于字典学习的 KSVD 方法[35],此方法能够根据不同训练样本自适应的构造出新的字典 D’。其 KSVD 名字的由来是该方法要经过
【参考文献】:
期刊论文
[1]多重耐药铜绿假单胞菌的两种同源性分析方法的比较[J]. 李进,胡韦维,张峰领,黎敏,陈鸣,邓少丽,鲁卫平. 第三军医大学学报. 2018(14)
[2]转录组学和蛋白质组学关联分析在植物研究中的应用[J]. 王晓丹,肖钢,张振乾,肖楠,陈浩,官春云. 基因组学与应用生物学. 2018(01)
[3]‘春甜橘’及其突变体果皮差异相关蛋白质组分析[J]. 曾继吾,邓贵明,高长玉,姜波,钟云,钟广炎,易干军. 中国农业科学. 2015(24)
[4]基于物理化学性质优化的蛋白质相互作用预测研究[J]. 倪青山,王正志,赵英杰,黎刚果. 生命科学研究. 2009(03)
[5]基于氨基酸序列预测蛋白质功能性点突变位点[J]. 宋卓,张宁,阮吉寿,杨卓,张涛. 生物物理学报. 2007(02)
[6]酵母基因上游与内含子可能存在的转录协同作用[J]. 张昆林,张静,罗静初. 生物化学与生物物理进展. 2005(01)
[7]植物F-box蛋白质及其研究进展[J]. 王洪云,黄剑,赖钊,薛勇彪. 科学通报. 2002(12)
硕士论文
[1]几类重要蛋白—蛋白相互作用的分子模拟[D]. 昝金行.北京协和医学院 2012
本文编号:3113216
本文链接:https://www.wllwen.com/projectlw/swxlw/3113216.html