当前位置:主页 > 科技论文 > 自动化论文 >

基于矩阵分解的lncRNA-疾病关联预测研究

发布时间:2024-07-02 23:23
  随着高通量生物技术的蓬勃发展和普遍应用,越发多的研究证实长链非编码RNA(lncRNA)在各种生物过程中起着关键作用并与多种复杂疾病存在关联。因此,预测潜在的lncRNA-疾病关联不仅有助于在lncRNA水平上揭示疾病的分子机制,而且还有助于生物标志物的发掘,进一步促进疾病的预防、诊断和治疗。近年来,已提出了各种机器学习模型来预测lncRNA-疾病关联,基于数据融合的方法普遍取得最优的效果。早期的方法通过简单的分子属性向量拼接融合数据进而识别lncRNA-疾病关联,但忽略了不同类型数据源的内在特性并造成维度爆炸等问题。基于分类器集成的监督学习为不同的数据源分别建立不同的模型再集成这些模型进行lncRNA-疾病关联预测,但这种集成模型易受低质量基础模型的影响。多视图学习可也可融合异质数据进行lncRNA-疾病关联预测,但是该类方法必须将与lncRNA或疾病相关联的多源数据转换为其同质数据,存在转换信息损失。基于矩阵分解的数据整合技术可以保持异质数据源的内部结构,但是无法差异性整合数据源,或者更倾向于选择稀疏的数据源进行融合,降低了整合效果。因此,研究高效的基于多源数据融合的lncRNA-...

【文章页数】:107 页

【学位级别】:硕士

【部分图文】:

图3-2WMLDA的lncRNA-疾病关联预测结果

图3-2WMLDA的lncRNA-疾病关联预测结果

牟僮骰岣哺堑粽庑┮熘适?菰吹谋旧斫峁埂6鳵WRlncD获得了较低的AUROC和AUPRC。这是因为RWRlncD仅使用了已知的lncRNA-疾病关联来预测潜在的lncRNA-疾病关联。图3-2中的实验结果证明,与仅使用单一数据源的算法相比,基于多源数据融合方法在预测lncRNA-....


图3-3WMFLDA在每对和的取值变化下的AUPRC

图3-3WMFLDA在每对和的取值变化下的AUPRC

西南大学硕士学位论文46从图3-3中可以看出,当7=10和=106时,WMFLDA取得最高的AUPRC。由图3-3所示,的取值会显著影响算法的性能,AUPRC值随的增加而增加,并在410时达到平稳状态。这是因为当值过小,异质关联矩阵的权重也被分配的很小,导致目标关联矩阵(lncR....


图3-4WMFLDA在不同取值下的同质关联网络权重分配5(1)

图3-4WMFLDA在不同取值下的同质关联网络权重分配5(1)

西南大学硕士学位论文46从图3-3中可以看出,当7=10和=106时,WMFLDA取得最高的AUPRC。由图3-3所示,的取值会显著影响算法的性能,AUPRC值随的增加而增加,并在410时达到平稳状态。这是因为当值过小,异质关联矩阵的权重也被分配的很小,导致目标关联矩阵(lncR....


图3-5WMFLDA的收敛曲线

图3-5WMFLDA的收敛曲线

ㄖ匚?0,并且当6=10时,WMFLDA取得最高的AUROC和AUPRC。之所以会抛弃掉部分同质关联矩阵,是因为这些矩阵相较于所选择的同质关联矩阵来说,其内部噪声较高,并且所选择的同质关联矩阵具有更可靠的内部关联来对lncRNA-疾病关联进行准确预测。因此,上述实验证明了WMFL....



本文编号:4000169

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4000169.html

上一篇:基于SNMP/IPMI的数据采集框架的设计与实现  
下一篇:没有了

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3dca3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com