利用机器学习算法预测绵羊全基因组蛋白质互作关系
发布时间:2020-07-01 04:41
【摘要】:绵羊对推动我国畜牧业发展具有重要经济意义。绵羊生产和养殖过程中还有诸如遗传基础与营养调控等相关分子机制需要解析。蛋白质-蛋白质相互作用(PPI)也是在分子生物学中解决上述分子机制的重要入手点。目前尚未发现有关于绵羊PPI的系统预测和研究。基于上述背景,本研究针对绵羊全基因组的PPI进行研究,包括PPI预测以及其数据库的搭建。首先,本研究利用机器学习方法对绵羊基因组范围内PPI进行预测。筛选来源于20个数据库的20类蛋白质注释信息,作为后续计算方法训练用到的特征数据。通过比较6种常见的机器学习方法(随机森林、决策树、贝叶斯分类器、逻辑回归、支持向量机和神经网络),发现随机森林分类模型的准确率可达0.89、精确率为0.99、AUC为0.95,显著优于其他分类器。因此最终确定随机森林作为本研究使用的模型分类方法。针对28,592个绵羊蛋白,本研究预测出820,072对绵羊蛋白互作关系。之后利用共表达以及直系同源数据进一步佐证了预测结果的生物学意义。其次,基于预测的全基因组绵羊PPI数据,成功搭建绵羊蛋白质互作数据库。数据库主要实现数据上传与存储、网络图的展示、相关蛋白质功能信息的展示等功能,为今后深入研究绵羊蛋白质互作及功能提供了有效的数据库资源。该研究为绵羊蛋白质研究提供了一个较完整的数据资源,为深入挖掘蛋白质互作机制、发现某些特定的生物功能提供了数据支撑,为从分子角度解析绵羊生物学机制进而对辅助解决绵羊养殖问题提供了一定的理论依据。
【学位授予单位】:内蒙古农业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP181;S826
【图文】:
图...帅曰口月..山,口.卜d时呢麟,,拓汽.翻叨.翻.之
图3使用PrePPI预测蛋白质-蛋白质相互作用逡逑Fig.3邋Predicting邋protein-protein邋interactions邋using邋PrePP逡逑
本文编号:2736292
【学位授予单位】:内蒙古农业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP181;S826
【图文】:
图...帅曰口月..山,口.卜d时呢麟,,拓汽.翻叨.翻.之
图3使用PrePPI预测蛋白质-蛋白质相互作用逡逑Fig.3邋Predicting邋protein-protein邋interactions邋using邋PrePP逡逑
【参考文献】
相关期刊论文 前7条
1 李杨;;构建基于Linux、Apache、MySQL、PHP平台的网站[J];电子技术与软件工程;2015年04期
2 芦方茹;马云;徐永杰;雷玲;宋新强;;基于双向电泳技术的家畜蛋白质组学研究进展[J];家畜生态学报;2014年01期
3 杨婧;黄原;汪晓阳;;直系同源基因的识别方法与数据库[J];生命科学研究;2013年03期
4 杨博辉;岳耀敬;王丽萍;牛春娥;焦硕;孙晓萍;郭健;刘建斌;郎侠;;绵羊基因组研究进展[J];中国草食动物;2009年06期
5 姜广辉;张凤荣;陈军伟;段增强;苏子友;;基于Logistic回归模型的北京山区农村居民点变化的驱动力分析[J];农业工程学报;2007年05期
6 郭晓红,储明星,周忠孝;绵羊基因组研究进展[J];遗传;2004年01期
7 郑江平;绵羊营养紊乱引起的几种疾病及对策[J];草食家畜;2001年04期
相关博士学位论文 前2条
1 张端午;RIP3作为细胞凋亡与细胞坏死相互转换的分子开关的发现及机理研究[D];厦门大学;2009年
2 邢万金;绒山羊和绵羊Izumo1和CD9基因的克隆及其相互作用的初步研究[D];内蒙古大学;2009年
相关硕士学位论文 前2条
1 王欢;基于信息整合方法系统分析拟南芥基因与表型的关联[D];华东师范大学;2015年
2 李鹏;拟南芥突变体网络分析平台开发[D];东北林业大学;2010年
本文编号:2736292
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2736292.html