基于正例和未标记样本策略及矩阵填充的miRNA相关研究

发布时间:2021-01-19 17:18
  微RNA(microRNA,miRNA)是指长约为22个核苷酸的非编码RNA,是由细胞的内源性发卡结构转录和加工而成。MiRNA常常被用来当作疾病诊断的生物标志物,而且还有研究者将miRNA当作药物的靶点进而治疗疾病。因此,发掘更多的疾病-miRNA关联将有助于理解疾病的发病机制,能促进对于疾病的诊断、预后和治疗。基于计算的预测模型可以有效地预测最可能与疾病相关的miRNA,从而降低发现新的疾病-miRNA关联的实验成本。本文所用到的数据包括疾病-miRNA关联、疾病语义相似性、miRNA功能相似性、疾病的集成相似性和miRNA的集成相似性。本文提出了两种计算模型IMCMDA和PUMDA。在IMCMDA中,疾病的集成相似性和miRNA的集成相似性作为辅助信息,并利用归纳矩阵填充算法预测潜在的疾病-miRNA关联。本文采用局部留一交叉验证、全局留一交叉验证和5折交叉验证来评估模型的性能。在IMCMDA的实验部分,本文对结肠癌、肾脏肿瘤、淋巴癌、乳腺癌和食管癌5种疾病进行案例研究。在预测的前50名疾病相关的miRNA中,分别有42、44、45、50和49个miRNA被数据库验证。在PUMD... 

【文章来源】:中国矿业大学江苏省 211工程院校 教育部直属院校

【文章页数】:66 页

【学位级别】:硕士

【图文】:

基于正例和未标记样本策略及矩阵填充的miRNA相关研究


胆脂瘤和脱发症的DAG图

流程图,流程图,模型,疾病


3基于归纳矩阵填充算法的疾病-miRNA关联预测13图3-1IMCMDA模型的流程图Figure3-1FlowchartofIMCMDA其中1,2是正则化系数,且通常都设为1,‖‖是矩阵的Frobenius范数,也称为范数。12‖‖2是目标函数,12‖‖2和22‖‖2是惩罚项,用来防止过拟合问题。我们采用Jain等人[81]提出的方法来求解上述问题。首先,将和随机为一个稠密矩阵,然后使用迭代更新公式求解和,当满足收敛准则时,迭代应停止,通常将收敛的阈值设置为106。IMCMDA的代码基于Matlab2019b。图3-1给出了求解迭代问题的详细算法步骤。当和求出来之后,可以通过以下公式计算疾病()和miRNA()之间的预测得分:((),())=(,:)(,:)(3-3)值得注意的是,如果有一个没有任何已知的相关miRNA的新疾病(),只要有新疾病()的辅助信息,IMCMDA一样能预测这个新疾病与所有

ROC曲线,硕士学位,论文,ROC曲线


IMCMDA与前人模型在LOOCV中的基于ROC曲线的性能对比

【参考文献】:
期刊论文
[1]生物信息学研究进展[J]. 李洪东,朱晓姝,王建新.  玉林师范学院学报. 2018(05)
[2]基于Biased-SVM的非平衡半监督分类算法[J]. 杜利敏,徐扬.  河南大学学报(自然科学版). 2017(04)
[3]低秩矩阵填充典型算法[J]. 邓军,谢鲲.  电子制作. 2017(09)
[4]microRNA与人类疾病关系研究中的生物信息学方法和资源[J]. 张帆,崔庆华.  生理科学进展. 2016(03)
[5]压缩感知与矩阵填充及其在图像处理中的应用[J]. 赵玉娟,郑宝玉,陈守宁.  南京邮电大学学报(自然科学版). 2015(03)
[6]矩阵填充及其在信号处理中的应用[J]. 赵玉娟,郑宝玉,陈守宁.  信号处理. 2015(04)
[7]基于填充和相似性信任因子的协同过滤推荐算法[J]. 郝立燕,王靖.  计算机应用. 2013(03)
[8]miRNA研究进展[J]. 刘强,郑秀峰,辛永红.  重庆医学. 2009(15)
[9]microRNA与肿瘤[J]. 周凡,庄诗美.  生命科学. 2008(02)
[10]计算生物学开拓现代生物技术研究的未来[J]. 赵陈同.  江苏科技信息. 2005(10)



本文编号:2987393

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2987393.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户75780***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com