蛋白质—蛋白质相互作用的简易预测工具开发与实例研究
【学位授予单位】:中国农业大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:Q51
【图文】:
UniProtKB/Swiss-Prot数据库中。一个事实是,尽管同出一门(UniProt Consortium, 2015),两者的蛋白条目数长期存在着数量级的差异,而且这个差异正在逐步加大。如图1-1所示,根据UniProt定期更新的数据库统计信息(http://www.uniprot.org/statistics/), 2014年1月,TrEMBL蛋白记录数约为5000万,而Swiss-Prot蛋白记录数约为54万。而仅仅一年过后,TrEMBL蛋白记录数己迅速跃进至接近9000万的水平,而Swiss-Prot增长平缓,仅达到接近55万(547085)的水平。值得注意的是,考虑到序列同源性,蛋白质序列信息总量与功能信息总量的差异并没有如此巨大。然而
的计算预测方法成为了对实验鉴定方法的重要补充。如图1-2所示,蛋白互作的计算预测方法大体可以归为依赖同源性的方法与不依赖同源性的方法。依赖同源性的方法可以进一步分为直接映射方法和共进化方法,不依赖同源性的方法又可以分为关联法与基于序列的机器学习方法。下面首先对一些代表性方法进行简介,然后对本论文所涉及的机器学习法的一般流程加以详细介绍。1.1.2.1 依赖同源性的计算预测方法直系同源蛋白互作对映射法(interologmapping):直系同源蛋白互作对(interolog)这一概念最早由Vidal课题组提出,指的是不同物种间一对直系同源蛋白间保守的互作关系(Matthews et al.,2001)o他们发现,这种保守的互作关系并不罕见,在抽选的直系同源蛋白对中,16%-31%的互作关系在物种间是保守的。这一发现大大鼓舞了相关方法学的发展,即将模式生物测定的蛋白互作信息转移给其它物种的直系同源蛋白对。这一方法的优点是不需要任何异源数据(如转录组)信息
图.妞州仁.0r门}wco甲佃娜颐训0口taeIs"护峨下阳O肠州.f口d.月,娜喊的亡C加r脚衬抽倪协的翻e矛,p目川
【共引文献】
相关期刊论文 前10条
1 庄振华;王年;李学俊;梁栋;王继;;癌症基因表达数据的熵度量分类方法[J];安徽大学学报(自然科学版);2010年02期
2 陈乐;王年;苏亮亮;王蕊平;;基于邻接谱主分量分析的肿瘤分类方法[J];安徽大学学报(自然科学版);2011年04期
3 叶爱霞;王年;苏亮亮;;基于非负矩阵分解和Normal_Matrix的肿瘤基因分类[J];安徽大学学报(自然科学版);2012年03期
4 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
5 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
6 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
7 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
8 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
9 邹心遥;姚若河;;基于LSSVM的威布尔分布形状参数估计(英文)[J];半导体技术;2008年06期
10 邹心遥;姚若河;;基于LSSVM的小子样元器件寿命预测[J];半导体技术;2011年09期
相关会议论文 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
3 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
4 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
5 ;State Estimation Model of Ferment Process Based on PSO[A];第二十九届中国控制会议论文集[C];2010年
6 常俊林;魏巍;梁君燕;;基于支持向量机的SURF改进算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年
7 ;Research of Intelligent Control Model and System on Traffic Light Time[A];中国自动化学会控制理论专业委员会D卷[C];2011年
8 刘友强;李斌;奚宁;陈家骏;;基于双语平行语料的中文缩略语提取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 陈龙;吴志勇;袁春;蒙美玲;蔡莲红;;面向数字版权管理的声纹辅助认证系统[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
10 颜七笙;;基于PCA-SVM的动态联盟候选伙伴绩效评价方法[A];第十三届中国管理科学学术年会论文集[C];2011年
相关博士学位论文 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
4 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
5 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
6 章鹏;多尺度特征检测:方法和应用研究[D];中国科学技术大学;2010年
7 张昌明;新疆汉族、维吾尔族及哈萨克族食管癌血清蛋白质指纹图谱研究[D];新疆医科大学;2010年
8 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
9 吕宁;基于数据驱动的故障诊断模型及算法研究[D];哈尔滨理工大学;2009年
10 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
相关硕士学位论文 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
3 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
4 刘磊;多泥沙河流水库优化调度研究[D];郑州大学;2010年
5 辛保兵;既有预应力混凝土梁桥剩余承载力评估方法研究[D];郑州大学;2010年
6 王巧立;微生物发酵过程的建模与优化控制研究[D];郑州大学;2010年
7 林天威;基于视频流的人脸识别系统研究[D];哈尔滨工程大学;2010年
8 韩艳;基于支持向量机的发酵过程建模研究[D];大连理工大学;2010年
9 马稳;基于支持向量机的模拟电路故障诊断研究[D];大连理工大学;2010年
10 梁怀志;基于嵌入式的车型分类系统的设计与实现[D];大连理工大学;2010年
本文编号:2799587
本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/2799587.html