基于低秩变异字典和反投影组稀疏表示的肿瘤分类
发布时间:2021-12-10 17:56
恶性肿瘤是严重危害人类生命和健康的重大疾病,随着生物信息技术的快速发展,利用微阵列基因表达数据在基因水平上研究肿瘤发生发展机理,有助于肿瘤诊断和个性化治疗.稀疏表示和低秩分解是基于微阵列基因表达数据的肿瘤分类方法研究的重点方法.稀疏表示分类当每类有足够多的训练样本时,能获得理想的识别结果,随着训练样本的减少,分类效果受到较大的影响.基于反投影的伪全空间表示分类是一种改进的稀疏表示分类方法,旨在挖掘现有的少量有标签的训练样本和大量没有标签的样本之间的互补信息,成功用于人脸识别.然而,微阵列基因表达数据不具有这种互补性.低秩分解将数据分解为低秩部分和稀疏部分,并利用体现样本间共同信息的低秩部分恢复原始样本信息,然而,忽略了反映样本间病变信息的稀疏部分对肿瘤分类的影响.基于此,本文主要做了如下研究工作:(1)构造了两种低秩变异字典.以一个全新的视角,通过探讨正常人和患者的微阵列基因表达数据的变化来处理肿瘤分类问题,在此基础上根据实际临床需要构建了一种元素固定的低秩变异字典和一种元素变化的低秩变异字典.(2)提出了一种反投影组稀疏表示分类模型.在充分利用少量训练样本和大量现有样本的基础上,结合...
【文章来源】:河南大学河南省
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
微阵列基因表达矩阵的获取.
第二章 肿瘤基因的基本理论习器的性能作为特征子集的评价准则, 也就是说, 包裹式的目的是器选择最有利于其性能的特征子集. 常见的包裹式特征方法有: 拉 (Las Vegas Wrapper, LVW)、包裹式支持向量机 (Wrapper SVM)等嵌入式. 将特征选择与学习器训练过程融为一体的特征选择方过程被嵌入到训练学习器的过程中. 例如: LASSO (Least ge and Selection Operator) 等.
的迭代向量0z 和0y 可取任意值. ADMM 算法理论逐渐趋于成域得到广泛应用.5 肿瘤分类的评价指标瘤样本的分类精度进行评价时, 常采用统计学中的独立检验交叉验证[44](Cross Validation), 也称作循环估计 (Rotation E计学上将数据样本切割成较小子集的使用方法. 交叉验证则进行分组, 比如把数据分成 K 等份, 轮流将其中 K -1份当做训为验证集, 交叉验证重复K 次, K 次结果的均值作为对算法精当K 等于样本个数时, 则退化为留一交叉验证[45], 但是这种交比较长. 由于肿瘤样本比较少, 为保证预测精度的可靠性, 本叉验证方法, 能够有效地避免过学习及欠学习状态的发生, 因有说服性. 图 2-7 展示了一个两类数据集上的十折交叉验证图
【参考文献】:
期刊论文
[1]Robust Face Recognition via Low-rank Sparse Representation-based Classification[J]. Hai-Shun Du,Qing-Pu Hu,Dian-Feng Qiao,Ioannis Pitas. International Journal of Automation and Computing. 2015(06)
[2]基于Gabor低秩恢复稀疏表示分类的人脸图像识别方法[J]. 杜海顺,张旭东,金勇,侯彦东. 电子学报. 2014(12)
[3]基于迭代Lasso的肿瘤分类信息基因选择方法研究[J]. 张靖,胡学钢,李培培,张玉红. 模式识别与人工智能. 2014(01)
[4]脑胶质瘤细胞、组织中PGAM1 mRNA、蛋白的表达变化及意义[J]. 刘志国,李连陵,王通. 山东医药. 2013(02)
[5]磷酸甘油酸变位酶1(PGAM1)在乳腺癌及癌旁正常组织中的表达及意义[J]. 王娟,陆彬彬,李娟,德伟,王科明. 现代肿瘤医学. 2011(11)
[6]基于聚类的肿瘤亚型发现模型[J]. 阮晓钢,周淑娟. 控制工程. 2007(02)
博士论文
[1]基于基因表达数据的肿瘤分类算法研究[D]. 陆慧娟.中国矿业大学 2012
本文编号:3533116
【文章来源】:河南大学河南省
【文章页数】:79 页
【学位级别】:硕士
【部分图文】:
微阵列基因表达矩阵的获取.
第二章 肿瘤基因的基本理论习器的性能作为特征子集的评价准则, 也就是说, 包裹式的目的是器选择最有利于其性能的特征子集. 常见的包裹式特征方法有: 拉 (Las Vegas Wrapper, LVW)、包裹式支持向量机 (Wrapper SVM)等嵌入式. 将特征选择与学习器训练过程融为一体的特征选择方过程被嵌入到训练学习器的过程中. 例如: LASSO (Least ge and Selection Operator) 等.
的迭代向量0z 和0y 可取任意值. ADMM 算法理论逐渐趋于成域得到广泛应用.5 肿瘤分类的评价指标瘤样本的分类精度进行评价时, 常采用统计学中的独立检验交叉验证[44](Cross Validation), 也称作循环估计 (Rotation E计学上将数据样本切割成较小子集的使用方法. 交叉验证则进行分组, 比如把数据分成 K 等份, 轮流将其中 K -1份当做训为验证集, 交叉验证重复K 次, K 次结果的均值作为对算法精当K 等于样本个数时, 则退化为留一交叉验证[45], 但是这种交比较长. 由于肿瘤样本比较少, 为保证预测精度的可靠性, 本叉验证方法, 能够有效地避免过学习及欠学习状态的发生, 因有说服性. 图 2-7 展示了一个两类数据集上的十折交叉验证图
【参考文献】:
期刊论文
[1]Robust Face Recognition via Low-rank Sparse Representation-based Classification[J]. Hai-Shun Du,Qing-Pu Hu,Dian-Feng Qiao,Ioannis Pitas. International Journal of Automation and Computing. 2015(06)
[2]基于Gabor低秩恢复稀疏表示分类的人脸图像识别方法[J]. 杜海顺,张旭东,金勇,侯彦东. 电子学报. 2014(12)
[3]基于迭代Lasso的肿瘤分类信息基因选择方法研究[J]. 张靖,胡学钢,李培培,张玉红. 模式识别与人工智能. 2014(01)
[4]脑胶质瘤细胞、组织中PGAM1 mRNA、蛋白的表达变化及意义[J]. 刘志国,李连陵,王通. 山东医药. 2013(02)
[5]磷酸甘油酸变位酶1(PGAM1)在乳腺癌及癌旁正常组织中的表达及意义[J]. 王娟,陆彬彬,李娟,德伟,王科明. 现代肿瘤医学. 2011(11)
[6]基于聚类的肿瘤亚型发现模型[J]. 阮晓钢,周淑娟. 控制工程. 2007(02)
博士论文
[1]基于基因表达数据的肿瘤分类算法研究[D]. 陆慧娟.中国矿业大学 2012
本文编号:3533116
本文链接:https://www.wllwen.com/yixuelunwen/zlx/3533116.html
最近更新
教材专著