面向癌症基因表达数据挖掘的低秩表示方法研究
发布时间:2023-05-14 07:41
当今,癌症是威胁人类生命的一大杀手。随着第二代测序技术的发展,产生了海量可用的基因表达数据。虽然,这类癌症数据包含丰富的基因表达信息,为科研工作者从分子水平揭露癌症的发病机制提供了数据支撑。但是,癌症测序数据通常具有“高维、小样本和强噪声”的特点,这无疑是癌症数据挖掘工作中的一个极大的挑战。低秩表示(Low-rank Representation,LRR)是一种实现数据降维、减小噪声影响的矩阵分解方法,在癌症数据挖掘方面已取得了很多的成功。在查阅归纳了大量国内外相关文献的基础上,本论文针对现有LRR方法存在的部分不足,提出三种新的LRR方法,并将之应用到癌症基因表达数据挖据中,旨在研究癌症病变的内部机理,更精确地分析癌症亚型。具体研究内容如下:(1)提出联合截断核范数和图正则的低秩表示方法:LRR方法从观测数据矩阵分解出的低秩矩阵的奇异值是快速减小的数据序列,因此,最小化所有奇异值的核范数不是近似矩阵秩函数的最佳选择。该方法采用截断核范数代替核范数处理低秩矩阵的凸松弛问题,保留了与矩阵相关的主要成分的信息,有效降低了奇异值收缩造成的损害,更准确地近似了矩阵的秩。并且新方法引入了图正则项...
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.3 论文主要内容
1.3.1 论文主要研究工作
1.3.2 论文创新点
1.3.3 论文组织结构
1.4 论文研究方法
第2章 相关研究工作、数据集及相关平台简介
2.1 相关研究工作
2.1.1 低秩表示(LRR)方法概述
2.1.2 潜在低秩表示(Lat LRR)方法概述
2.1.3 系统实现框架
2.2 数据集简介
2.2.1 基因表达数据简介
2.2.2 数据库简介
2.2.3 实验数据简介
2.3 结果分析平台简介
2.3.1 Gene Cards平台简介
2.3.2 Topp Gene Suite平台简介
第3章 联合截断核范数和图正则的低秩表示方法的研究及应用
3.1 引言
3.2 截断核范数和图正则化简介
3.2.1 截断核范数简介
3.2.2 图正则简介
3.3 联合截断核范数和图正则的低秩表示(TLLRR)方法
3.3.1 TLLRR模型构建
3.3.2 TLLRR模型求解
3.3.3 TLLRR算法的收敛性和时间复杂度分析
3.4 参数设置
3.4.1 实验数据
3.4.2 选参结果
3.5 实验结果与讨论
3.5.1 评价指标
3.5.2 差异表达基因识别
3.5.3 癌症样本聚类
3.6 本章小结
第4章 双超图正则化的低秩表示方法的研究及应用
4.1 引言
4.2 超图正则简介
4.3 双超图正则化的低秩表示(DHLRR)方法
4.3.1 DHLRR模型构建
4.3.2 DHLRR模型求解
4.3.3 DHLRR算法的收敛性和时间复杂度分析
4.4 参数设置
4.4.1 实验数据
4.4.2 选参结果
4.5 实验结果与讨论
4.5.1 评价指标
4.5.2 差异表达基因识别
4.5.3 癌症样本聚类
4.6 本章小结
第5章 联合截断核范数和图正则的潜在低秩表示方法的研究及应用
5.1 引言
5.2 联合截断核范数和图正则的潜在低秩表示(Lat-TGLRR)方法
5.2.1 Lat-TGLRR模型构建
5.2.2 Lat-TGLRR模型求解
5.2.3 Lat-TGLRR算法的收敛性和时间复杂度分析
5.3 参数设置
5.3.1 实验数据
5.3.2 选参结果
5.4 实验结果与讨论
5.4.1 评价指标
5.4.2 共差异表达基因识别
5.4.3 癌症样本聚类
5.5 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
在读期间发表的学术论文及研究成果
致谢
本文编号:3817477
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.3 论文主要内容
1.3.1 论文主要研究工作
1.3.2 论文创新点
1.3.3 论文组织结构
1.4 论文研究方法
第2章 相关研究工作、数据集及相关平台简介
2.1 相关研究工作
2.1.1 低秩表示(LRR)方法概述
2.1.2 潜在低秩表示(Lat LRR)方法概述
2.1.3 系统实现框架
2.2 数据集简介
2.2.1 基因表达数据简介
2.2.2 数据库简介
2.2.3 实验数据简介
2.3 结果分析平台简介
2.3.1 Gene Cards平台简介
2.3.2 Topp Gene Suite平台简介
第3章 联合截断核范数和图正则的低秩表示方法的研究及应用
3.1 引言
3.2 截断核范数和图正则化简介
3.2.1 截断核范数简介
3.2.2 图正则简介
3.3 联合截断核范数和图正则的低秩表示(TLLRR)方法
3.3.1 TLLRR模型构建
3.3.2 TLLRR模型求解
3.3.3 TLLRR算法的收敛性和时间复杂度分析
3.4 参数设置
3.4.1 实验数据
3.4.2 选参结果
3.5 实验结果与讨论
3.5.1 评价指标
3.5.2 差异表达基因识别
3.5.3 癌症样本聚类
3.6 本章小结
第4章 双超图正则化的低秩表示方法的研究及应用
4.1 引言
4.2 超图正则简介
4.3 双超图正则化的低秩表示(DHLRR)方法
4.3.1 DHLRR模型构建
4.3.2 DHLRR模型求解
4.3.3 DHLRR算法的收敛性和时间复杂度分析
4.4 参数设置
4.4.1 实验数据
4.4.2 选参结果
4.5 实验结果与讨论
4.5.1 评价指标
4.5.2 差异表达基因识别
4.5.3 癌症样本聚类
4.6 本章小结
第5章 联合截断核范数和图正则的潜在低秩表示方法的研究及应用
5.1 引言
5.2 联合截断核范数和图正则的潜在低秩表示(Lat-TGLRR)方法
5.2.1 Lat-TGLRR模型构建
5.2.2 Lat-TGLRR模型求解
5.2.3 Lat-TGLRR算法的收敛性和时间复杂度分析
5.3 参数设置
5.3.1 实验数据
5.3.2 选参结果
5.4 实验结果与讨论
5.4.1 评价指标
5.4.2 共差异表达基因识别
5.4.3 癌症样本聚类
5.5 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
在读期间发表的学术论文及研究成果
致谢
本文编号:3817477
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3817477.html
最近更新
教材专著