基于谱聚类算法的癌症分型研究
发布时间:2024-03-13 23:36
癌症分子表达水平具有高度异质性,异质性是指癌症组织内部存在的多个突变类型,它是癌症的基本特征之一,也是开展精准医学的最大难题。对于癌症患者进行治疗的依据是TNM分期,但预后效果欠佳。具有相同临床分期或病理特征的癌症患者采用相同治疗方案存在明显的预后差别。发现癌症组织内存在的分子亚型,进而解析遗传与表观遗传因素及其调控机制,是癌症异质性产生的机制研究中的一个重要的科学问题。基于癌症多组学数据对其分子亚型进行识别,为解析癌症的高度异质性,提高预后判别的准确性,选择有效化疗药物实现个体化治疗提供了重要的依据。本文提出了一种基于高斯混合模型的谱聚类算法识别癌症分子亚型,解析癌症的高度异质性,有效地区分具有不同预后效果的多类病患。利用癌症多组学数据作为训练集样本,构建癌症分子亚型预测模型。将所述预测模型用于预测独立测试集样本的癌症分子亚型,将癌症样本集划分为多类分子亚型。基于高斯混合模型的谱聚类算法能够有效地区分具有不同预后效果的多类病患,提高了癌症预后判别的准确性,为选择有效化疗药物实现个体化治疗提供重要依据。识别癌症分子亚型为靶向治疗以及肿瘤分类与分层治疗提供科学评价,对于癌症的早期诊断、个...
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
本文编号:3927737
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
图5.1BRCA训练集的轮廓系数图
图5.1BRCA训练集的轮廓系数图Figure5.1OutlineoftheBRCAtrainingset
图5.2GBM训练集的轮廓系数图
图5.2GBM训练集的轮廓系数图Figure5.2OutlinecoefficientmapoftheGBMtrainingset样本数对应平均宽度的加权平均值即为其中的平均轮廓宽度。通过比较训练集测试集的结果可知,轮廓系数的值在k=3,5,6,7时较....
图5.4GBM测试集的轮廓系数图
31图5.4GBM测试集的轮廓系数图Figure5.4OutlineoftheGBMtestset样本数对应平均宽度的加权平均值即为其中的平均轮廓宽度。
图5.5GBM训练集数据
p=0.048)h(k=10,p=0.027)图5.5GBM训练集数据Figure5.5GBMtrainingsetdataa(k=3,p=0.012)b(k=4,p=0.041)
本文编号:3927737
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3927737.html