基于推荐算法的lncRNA与蛋白质相互作用预测研究
发布时间:2021-08-02 12:18
lncRNA(长非编码RNA)是一类长度超过200个核苷酸的非编码RNA,近年来受到科学研究的热切关注。越来越多的研究表明,lncRNA与基因表达水平的调节有关,如表观遗传、转录调控和转录后调控等,然而只有少数的lncRNA功能和机制被阐明。lncRNA通过与蛋白质相互作用,在各种生物过程中发挥着广泛而重要的作用。因此,lncRNA与蛋白质互作关系的预测和鉴定可以进一步揭示lncRNA相关的功能,并且有利于在分子水平上研究复杂疾病的发病机制。传统的生物实验方法能够准确鉴定lncRNA与蛋白质的互作关系,但这类方法难度大且费时费力。近年来,越来越多计算机领域的研究学者密切关注着生物信息学相关的前沿交叉学科的发展,并致力于将机器学习和统计学习应用到生物数据挖掘的研究中。因此,一些计算模型被提出来预测lncRNA与蛋白质的互作关系。利用已有的相关数据来预测潜在的lncRNA与蛋白质互作关系,可以为未来进一步研究lncRNA提供有益的帮助。在前人相关工作的基础上,本文提出基于改进的二分网络推荐算法的lncRNA与蛋白质相互作用预测模型LPI-IBNRA。首先,收集并整理lncRNA和蛋白质的生...
【文章来源】:广东工业大学广东省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
二分网络示意图
广东工业大学硕士学位论文10123,,,,nO=oooo表示产品。E表示边的集合。同类节点之间不存在边,两类节点之间有连边代表用户选择过产品。用户-产品网络可以用矩阵ijmnAa=表示。如果用户iu选择过产品jo,那么用户iu与产品jo之间连接一条边,1ija=,未选择过则0ija=。当用户选择过某产品,可以假设用户喜欢该产品。()iku表示用户iu的度,即用户iu选择过的产品数量。()jko表示产品jo的度,即选择过产品jo的用户数量。推荐算法的目标是预测用户对所有未选择过的产品的喜好程度,根据喜好程度对产品打分并排序,把排名靠前的产品推荐给用户。假设曾经被用户iu选择过的产品,都拥有某种将其它产品推荐给用户iu的能力,这种能力可以抽象为可量化的资源值,那么,理论上拥有资源值的产品会倾向于将更多的资源值传递给用户iu可能感兴趣的产品。对于由m个用户和n个产品构成的二分网络,产品单顶点网络中的边的权重ijw,表示产品io愿意传递给产品jo的资源值。图2-2物质扩散推荐算法过程Fig.2-2TheProcessofProbabilisticSpreadingRecommenderAlgorithm物理学中的物质扩散是指物质分子从浓度较高的区域向浓度较低的区域转移的现象,物质扩散推荐算法(probabilisticspreadingalgorithm,ProbS)将该物理现象应用于推荐过程中,在二分网络不同类型的节点之间转移资源值来模拟物质扩散的过程。假设二分网络是无权二分图,那么任意用户节点的资源值能够均匀地扩散到与其邻接的产品节点上,同理,任意产品节点的资源值也能够均匀地扩散到与其邻接的用户节点上。物质扩散推荐算法的推荐过程实际上是在二分网络上进行资源分配的过程,如图2-2所示。资源分配过程分为三个步骤:初始资源配置、第一次资源转移和第二次资源转移。
广东工业大学硕士学位论文122.3.2热传导推荐算法热传导推荐算法(heatspreadingalgorithm,HeatS)是将物理学中的热量传导原理应用在推荐过程中。在物理学中,热平衡方程原理如下公式:()()2kTr=rJ(2.6)其中k表示导热,()2rT表示温度梯度,J(r)?表示局部热量。将热传导的思想应用于推荐过程中,计算公式为:0Hs=Ws(2.7)其中WH表示传递矩阵,矩阵中的元素ijw表示从产品io传导给产品jo的资源。0s表示初始资源,相当于公式(2.6)中的()2kTr邓,s表示热传导完成后的资源,相当于公式(2.6)中的J(r)?。公式(2.7)是将热传导方程进行离散化。图2-3热传导推荐算法过程Fig.2-3TheProcessofHeatSpreadingRecommenderAlgorithm使用物理学热传导原理的推荐算法是基于矩阵运算的,算法的时间复杂度和空间复度都很高,无法应用于大规模的数据算理和运算中。Zhou等人将二分网络和热传导的思想进行结合,提出了更加形象的热传导推荐算法[40]。该算法计算简单,预测多样性较好,且能应用到大规模的数据预测中。一个任意的二分网络G(U,O,E),其中123,,,,mU=uuuu表示m个用户节点的集合,123,,,,nO=oooo表示n个产品节点集合,E表示两种不同类型节点之前边的集合。用户-产品网络可以用矩阵ijmnAa=表示。如果用户iu选择过产品jo,那么用户iu与产品jo之间连接一条边,1ija=,反之则0ija=。当用户选择过某产品,
【参考文献】:
期刊论文
[1]长链非编码RNA生物学特性和功能研究进展[J]. 计红,李悦,牛春阳,詹雪龙,郭景茹,甄莉,杨焕民,李士泽. 黑龙江八一农垦大学学报. 2019(02)
[2]长链非编码RNA与肿瘤代谢的研究进展[J]. 姚志峰,张译文,姚建新,陈锦飞. 中国肿瘤. 2019(04)
[3]lncRNA生物学功能研究进展[J]. 牛春阳,薛琳琳,计红,李士泽. 中国生物制品学杂志. 2019(02)
[4]长链非编码RNA的异常表达在肿瘤中的作用[J]. 杨培培,宇龙,孔旭,杨文奇. 安徽医学. 2018(11)
[5]基于二分网络社团划分的推荐算法[J]. 陈东明,严燕斌,黄新宇,王冬琦. 东北大学学报(自然科学版). 2018(08)
[6]推荐系统算法在生物信息学中应用的研究进展[J]. 赵琪,于海帆,胡桓,张力,刘宏生. 辽宁大学学报(自然科学版). 2017(04)
[7]长链非编码RNA-蛋白质相互作用在肿瘤研究中的新进展[J]. 李梦轩,薛逸荃,曹雪涛. 中国肿瘤生物治疗杂志. 2017(04)
[8]生物信息学在长非编码RNA研究中的应用[J]. 李俊豪,杨建华,屈良鹄. 生理科学进展. 2016(03)
[9]非编码RNA对基因转录的调控[J]. 刘旭,单革. 生命科学. 2016(05)
[10]A Bipartite Network-based Method for Prediction of Long Non-coding RNA–protein Interactions[J]. Mengqu Ge,Ao Li,Minghui Wang. Genomics,Proteomics & Bioinformatics. 2016(01)
博士论文
[1]基于相似性网络的疾病miRNAs预测方法研究及应用[D]. 李小英.湖南大学 2018
硕士论文
[1]基于矩阵分解算法的长非编码RNA-蛋白质相互作用预测研究[D]. 张添翼.中国科学技术大学 2018
[2]基于物质扩散的个性化推荐算法研究[D]. 陈桂林.北京邮电大学 2018
[3]网络结构对推荐算法影响的研究[D]. 李健.电子科技大学 2017
[4]推荐网络分析及个性化推荐算法研究[D]. 关远.电子科技大学 2014
[5]基于二分网络的个性化推荐系统研究[D]. 韩腾跃.南昌航空大学 2013
本文编号:3317552
【文章来源】:广东工业大学广东省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
二分网络示意图
广东工业大学硕士学位论文10123,,,,nO=oooo表示产品。E表示边的集合。同类节点之间不存在边,两类节点之间有连边代表用户选择过产品。用户-产品网络可以用矩阵ijmnAa=表示。如果用户iu选择过产品jo,那么用户iu与产品jo之间连接一条边,1ija=,未选择过则0ija=。当用户选择过某产品,可以假设用户喜欢该产品。()iku表示用户iu的度,即用户iu选择过的产品数量。()jko表示产品jo的度,即选择过产品jo的用户数量。推荐算法的目标是预测用户对所有未选择过的产品的喜好程度,根据喜好程度对产品打分并排序,把排名靠前的产品推荐给用户。假设曾经被用户iu选择过的产品,都拥有某种将其它产品推荐给用户iu的能力,这种能力可以抽象为可量化的资源值,那么,理论上拥有资源值的产品会倾向于将更多的资源值传递给用户iu可能感兴趣的产品。对于由m个用户和n个产品构成的二分网络,产品单顶点网络中的边的权重ijw,表示产品io愿意传递给产品jo的资源值。图2-2物质扩散推荐算法过程Fig.2-2TheProcessofProbabilisticSpreadingRecommenderAlgorithm物理学中的物质扩散是指物质分子从浓度较高的区域向浓度较低的区域转移的现象,物质扩散推荐算法(probabilisticspreadingalgorithm,ProbS)将该物理现象应用于推荐过程中,在二分网络不同类型的节点之间转移资源值来模拟物质扩散的过程。假设二分网络是无权二分图,那么任意用户节点的资源值能够均匀地扩散到与其邻接的产品节点上,同理,任意产品节点的资源值也能够均匀地扩散到与其邻接的用户节点上。物质扩散推荐算法的推荐过程实际上是在二分网络上进行资源分配的过程,如图2-2所示。资源分配过程分为三个步骤:初始资源配置、第一次资源转移和第二次资源转移。
广东工业大学硕士学位论文122.3.2热传导推荐算法热传导推荐算法(heatspreadingalgorithm,HeatS)是将物理学中的热量传导原理应用在推荐过程中。在物理学中,热平衡方程原理如下公式:()()2kTr=rJ(2.6)其中k表示导热,()2rT表示温度梯度,J(r)?表示局部热量。将热传导的思想应用于推荐过程中,计算公式为:0Hs=Ws(2.7)其中WH表示传递矩阵,矩阵中的元素ijw表示从产品io传导给产品jo的资源。0s表示初始资源,相当于公式(2.6)中的()2kTr邓,s表示热传导完成后的资源,相当于公式(2.6)中的J(r)?。公式(2.7)是将热传导方程进行离散化。图2-3热传导推荐算法过程Fig.2-3TheProcessofHeatSpreadingRecommenderAlgorithm使用物理学热传导原理的推荐算法是基于矩阵运算的,算法的时间复杂度和空间复度都很高,无法应用于大规模的数据算理和运算中。Zhou等人将二分网络和热传导的思想进行结合,提出了更加形象的热传导推荐算法[40]。该算法计算简单,预测多样性较好,且能应用到大规模的数据预测中。一个任意的二分网络G(U,O,E),其中123,,,,mU=uuuu表示m个用户节点的集合,123,,,,nO=oooo表示n个产品节点集合,E表示两种不同类型节点之前边的集合。用户-产品网络可以用矩阵ijmnAa=表示。如果用户iu选择过产品jo,那么用户iu与产品jo之间连接一条边,1ija=,反之则0ija=。当用户选择过某产品,
【参考文献】:
期刊论文
[1]长链非编码RNA生物学特性和功能研究进展[J]. 计红,李悦,牛春阳,詹雪龙,郭景茹,甄莉,杨焕民,李士泽. 黑龙江八一农垦大学学报. 2019(02)
[2]长链非编码RNA与肿瘤代谢的研究进展[J]. 姚志峰,张译文,姚建新,陈锦飞. 中国肿瘤. 2019(04)
[3]lncRNA生物学功能研究进展[J]. 牛春阳,薛琳琳,计红,李士泽. 中国生物制品学杂志. 2019(02)
[4]长链非编码RNA的异常表达在肿瘤中的作用[J]. 杨培培,宇龙,孔旭,杨文奇. 安徽医学. 2018(11)
[5]基于二分网络社团划分的推荐算法[J]. 陈东明,严燕斌,黄新宇,王冬琦. 东北大学学报(自然科学版). 2018(08)
[6]推荐系统算法在生物信息学中应用的研究进展[J]. 赵琪,于海帆,胡桓,张力,刘宏生. 辽宁大学学报(自然科学版). 2017(04)
[7]长链非编码RNA-蛋白质相互作用在肿瘤研究中的新进展[J]. 李梦轩,薛逸荃,曹雪涛. 中国肿瘤生物治疗杂志. 2017(04)
[8]生物信息学在长非编码RNA研究中的应用[J]. 李俊豪,杨建华,屈良鹄. 生理科学进展. 2016(03)
[9]非编码RNA对基因转录的调控[J]. 刘旭,单革. 生命科学. 2016(05)
[10]A Bipartite Network-based Method for Prediction of Long Non-coding RNA–protein Interactions[J]. Mengqu Ge,Ao Li,Minghui Wang. Genomics,Proteomics & Bioinformatics. 2016(01)
博士论文
[1]基于相似性网络的疾病miRNAs预测方法研究及应用[D]. 李小英.湖南大学 2018
硕士论文
[1]基于矩阵分解算法的长非编码RNA-蛋白质相互作用预测研究[D]. 张添翼.中国科学技术大学 2018
[2]基于物质扩散的个性化推荐算法研究[D]. 陈桂林.北京邮电大学 2018
[3]网络结构对推荐算法影响的研究[D]. 李健.电子科技大学 2017
[4]推荐网络分析及个性化推荐算法研究[D]. 关远.电子科技大学 2014
[5]基于二分网络的个性化推荐系统研究[D]. 韩腾跃.南昌航空大学 2013
本文编号:3317552
本文链接:https://www.wllwen.com/projectlw/swxlw/3317552.html