联合约束非负矩阵分解方法研究及在组学数据中的应用

发布时间:2022-01-21 19:03
  癌症是严重影响人类健康的重大疾病之一。随着基因芯片技术和第二代测序技术的发展,产生了大量的癌症组学数据。此类数据往往具有数量大、增速快、价值高及高维小样本的特点。矩阵分解作为一种有效的降维技术,在生物信息学中有着广泛的应用。常用的矩阵分解技术有主成分分析(Principal Component Analysis,PCA)、矢量量化(Vector Quantization,VQ)及非负矩阵分解(Nonnegative Matrix Factorization,NMF)等。随着研究的不断深入,现有模型无法满足组学数据挖掘日益增长的需求。因此,本论文基于癌症基因图谱(The Cancer Genome Atlas,TCGA)中的组学数据,通过对现有NMF相关方法进行改进,从而提高方法的性能,为癌症的预防、诊断和治疗工作提供一定的参考价值。具体研究分为以下几个部分:(1)提出多约束非负矩阵分解(Multi-constrained Non-negative Matrix Factorization,MCNMF)方法。针对原有方法易受不稳定分解及数据噪声的影响,MCNMF方法在提高方法性能的同时能... 

【文章来源】:曲阜师范大学山东省

【文章页数】:67 页

【学位级别】:硕士

【部分图文】:

联合约束非负矩阵分解方法研究及在组学数据中的应用


MCNMF方法框架

示意图,方法,示意图,矩阵


第2章多约束非负矩阵分解方法9这个参数最佳选择非常重要,取决于数据本身的类别数。对于无监督学习,最佳参数的选择至关重要。使用所有参数组合来表示MCNMF的选参过程。为了节省空间,图2.2显示了Data1数据集和的选参结果。从图中可以看出MCNMF方法在较大范围内具有较高的结果,其中明亮的颜色表示良好的结果。图2.2MCNMF方法选参示意图2.3.3.收敛性分析通过在64GRAM的3.6GHzWindowsServer上的Inter(R)i7-7700CPUMatlabR2016a中实现MCNMF算法。四个数据集在MCNMF方法上的收敛曲线如图2.3所示。从图中可以看出,MCNMF方法大约在100次迭代时实现了收敛。图2.3MCNMF方法收敛性示意图2.4结果与讨论一种新的矩阵分解方法应用于组学数据集,目的是在矩阵分解后更准确地挖掘出共差异表达基因,而不是从原始的生物信息学数据中挖掘共差异表达基因。通过矩阵分解发现,生物过程对于疾病所需的聚类具有生物学意义。此外,在这些过程中挖掘的共差异表达基因有助于提高聚类性能。

示意图,收敛性,方法,示意图


第2章多约束非负矩阵分解方法9这个参数最佳选择非常重要,取决于数据本身的类别数。对于无监督学习,最佳参数的选择至关重要。使用所有参数组合来表示MCNMF的选参过程。为了节省空间,图2.2显示了Data1数据集和的选参结果。从图中可以看出MCNMF方法在较大范围内具有较高的结果,其中明亮的颜色表示良好的结果。图2.2MCNMF方法选参示意图2.3.3.收敛性分析通过在64GRAM的3.6GHzWindowsServer上的Inter(R)i7-7700CPUMatlabR2016a中实现MCNMF算法。四个数据集在MCNMF方法上的收敛曲线如图2.3所示。从图中可以看出,MCNMF方法大约在100次迭代时实现了收敛。图2.3MCNMF方法收敛性示意图2.4结果与讨论一种新的矩阵分解方法应用于组学数据集,目的是在矩阵分解后更准确地挖掘出共差异表达基因,而不是从原始的生物信息学数据中挖掘共差异表达基因。通过矩阵分解发现,生物过程对于疾病所需的聚类具有生物学意义。此外,在这些过程中挖掘的共差异表达基因有助于提高聚类性能。

【参考文献】:
期刊论文
[1]包含标签信息的最小二乘多标签特征选择算法[J]. 陈红,马盈仓,杨小飞,续秋霞.  南京理工大学学报. 2019(04)
[2]TCGA数据库:海量癌症数据的源泉[J]. 谢龙祥,闫中义,党艺方,厉永强,董寰,郭向前.  河南大学学报(医学版). 2018(03)
[3]ErbB3结合蛋白1的上调抑制食管癌细胞生长[J]. 姜浩,刘冬平,谢东,魏东芝.  生理学报. 2016(06)
[4]基于联合非负矩阵分解的协同过滤推荐算法[J]. 黄波,严宣辉,林建辉.  模式识别与人工智能. 2016(08)
[5]Robust Assignment of Airport Gates with Operational Safety Constraints[J]. Shuo Liu,Wen-Hua Chen,Jiyin Liu.  International Journal of Automation and Computing. 2016(01)
[6]稀疏约束图正则非负矩阵分解[J]. 姜伟,李宏,余震国,杨炳儒.  计算机科学. 2013(01)
[7]基于超图正则化模型的本体概念相似度计算[J]. 高炜,梁立.  微电子学与计算机. 2011(05)
[8]基于簇的K最近邻(KNN)分类算法研究[J]. 潘丽芳,杨炳儒.  计算机工程与设计. 2009(18)
[9]高维数据降维方法研究[J]. 余肖生,周宁.  情报科学. 2007(08)
[10]运用共词聚类分析法研究生物信息学的学科热点[J]. 张晗,崔雷.  医学情报工作. 2004(05)

硕士论文
[1]基于多维属性探索深度学习的多尺度疾病诊断预测研究[D]. 王伟伟.山东大学 2018
[2]基于基因本体术语相似性的通路功能网络构建和分析[D]. 陈明明.哈尔滨工业大学 2015



本文编号:3600791

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3600791.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ec03f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com