基于多示例多标记迁移学习的蛋白质功能预测
[Abstract]:With the introduction of various genome sequencing projects, many species have been sequenced, and the protein function of these species needs to be annotated. Since the number of known proteins in these species is small, we can consider the use of species with close kinship and a large number of known functional proteins to help these species predict their protein function. This article abstracts this task as a multi-example, multi-tag migration learning problem. The first multi-example multi-label migration learning framework (TR-MIML) is proposed to solve this task. TR-MIML assigns different weights to the source domain samples by minimizing the distance between the center points of the weighted source domain and the center points of the target domain samples in the projection space. And the multi-example multi-label learning model is trained based on target domain and source domain samples. In two newly sequenced species, the results show that migration learning is helpful to predict their protein function. In addition, the more closely related species are used as source areas for migration learning, the greater the help.
【作者单位】: 南京邮电大学通信与信息工程学院;南京信息工程大学江苏省优势学科江苏省大气环境与装备技术协同创新中心;河海大学计算机与信息学院;南京邮电大学地理与生物信息学院;
【基金】:国家自然科学基金(批准号:61571233,61271082) 国家重点基础研究发展计划(973)(批准号:2011CB302903) 江苏省高校自然科学研究重大项目(批准号:14KJA510003) 江苏省重点研发计划(批准号:BE2015700) 南京信息工程大学PAPD与CICAEET资助项目
【分类号】:Q51;TP181
【相似文献】
相关期刊论文 前10条
1 刘秀艳,滕胜;应用计算机识别蛋白质功能[J];生命的化学;2000年03期
2 曾岚,徐晋麟,李亦学,石铁流;大规模蛋白质功能预测方法的进展[J];生命的化学;2005年01期
3 卢宏超;石秋艳;石宝晨;张治华;赵屹;唐素勤;熊磊;王强;陈润生;;基于蛋白质网络功能模块的蛋白质功能预测[J];生物化学与生物物理进展;2006年05期
4 王繁业;李亚非;;用于新药开发的新的蛋白质功能预测方法[J];化学与生物工程;2006年09期
5 王秀鹤;王正华;王勇献;张振慧;;基于分组重量编码的蛋白质功能预测[J];生物信息学;2007年01期
6 倪青山;王正志;黎刚果;孟祥林;;基于K近邻的蛋白质功能的预测方法[J];生物医学工程研究;2009年02期
7 蒋英芝;贺连华;刘建军;;蛋白质功能研究方法及技术[J];生物技术通报;2009年09期
8 胡敏菁;吴建盛;施识帆;刘宏德;孙啸;;面向蛋白质功能位点识别的机器学习平台构建[J];生物信息学;2010年01期
9 赵研;卢奕南;权勇;;基于模糊积分多源数据融合的蛋白质功能预测[J];南京大学学报(自然科学版);2012年01期
10 吴建盛;;基于新型机器学习方法的蛋白质功能预测与分析[J];信息通信;2012年05期
相关会议论文 前8条
1 卢乃浩;张燕;李海玲;高中洪;;蛋白质酪氨酸硝化修饰对蛋白质功能影响及抗氧化剂的作用[A];第六届全国化学生物学学术会议论文摘要集[C];2009年
2 郭延芝;李梦龙;;蛋白质功能预测中的特征筛选与优化[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
3 汪世华;;蛋白质芯片用于快速检测的研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
4 郭延芝;文志宁;李梦龙;;基于序列信息的蛋白质功能预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
5 王靖;李霞;高磊;朱明珠;杨德武;;蛋白质功能位点和结构域与人类蛋白质互作关联分析[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
6 刘俊峰;王新泉;王占新;安晓敏;常文瑞;梁栋材;;造血干细胞中特异表达新基因kd93的重组表达和晶体结构研究[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
7 常珊;李春华;龚新奇;陈慰祖;王存新;;蛋白质不同区域的氨基酸保守性网络分析[A];第十次中国生物物理学术大会论文摘要集[C];2006年
8 李亦学;;蛋白质组功能注释[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
相关博士学位论文 前8条
1 滕志霞;基于序列和PPI网络的蛋白质功能预测方法研究[D];哈尔滨工业大学;2016年
2 杨润涛;分子生物学系统建模及蛋白质功能预测相关问题研究[D];山东大学;2016年
3 孙承磊;基于数据挖掘技术的蛋白质功能预测研究[D];上海大学;2013年
4 窦永超;预测蛋白质功能位点的几种新数学模型[D];大连理工大学;2011年
5 施绍萍;基于支持向量机的蛋白质功能预测新方法研究[D];南昌大学;2012年
6 俞晓晶;基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D];中国科学院研究生院(上海生命科学研究院);2006年
7 张同亮;基于智能计算的蛋白质功能预测研究[D];东华大学;2008年
8 张拓;两种特殊类型蛋白质功能残基的预测与生物序列比对[D];南开大学;2009年
相关硕士学位论文 前10条
1 郭金文;基于序列循环关系网络模型的蛋白质功能预测技术研究[D];福建师范大学;2015年
2 刁印;基于图理论和互作网络的蛋白质功能预测研究[D];大连理工大学;2015年
3 刘殿昆;NaHCO_3胁迫下柽柳(T.hispida)根部差异表达蛋白质的研究[D];东北林业大学;2016年
4 梁华东;基于流形学习的蛋白质功能预测与优化[D];安徽大学;2017年
5 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年
6 赵研;模糊积分在蛋白质功能预测上的应用[D];吉林大学;2012年
7 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年
8 王秀鹤;基于序列和相互作用的蛋白质功能预测[D];国防科学技术大学;2006年
9 邓小龙;基于随机游走的蛋白质功能预测方法的研究[D];吉林大学;2012年
10 贾元丰;基于复杂网络社团结构与贝叶斯网络模型的蛋白质功能预测[D];山西大学;2013年
,本文编号:2334564
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2334564.html