基于WGCNA方法的肝癌预后及分期研究
发布时间:2021-09-17 02:14
肝细胞癌(Hepatocellular carcinoma,HCC)是全球最常见的恶性肿瘤,也是全球第五大癌症相关死亡原因。HCC的发生发展是一个多基因参与、多因素作用、多阶段进展的较为复杂的生物学过程,我们对其发展和进步机制了解甚少。目前,在确定复发风险高的患者和肝细胞癌的早期诊断方面均存在着严重不足。因此,本文借助基因表达数据从内在的分子水平研究其临床表现,深入了解肝细胞癌的分子机制进而提高其诊治效果。首先,本文建立了基于基因表达数据的肝细胞癌预后模型。对表达数据进行预处理和差异表达分析,训练集借助加权基因共表达网络(WGCNA)构建模型,聚类出四个模块;再通过逐步Cox风险比例回归,发现turquoise模块与患者生存期显著相关,并且该模块基因主要富集在与代谢功能相关的过程中;然后,通过单因素Cox比例风险回归方法对该模块深入挖掘,从而得到45个与无复发生存期密切相关的基因,使用测试集进行验证,Kaplan-meier曲线和对数秩检验对分类结果的检验显示两组患者低风险标记组与高风险标记组的未复发率差异显著;最终将基因标记分组和临床信息共同作协变量,进一步验证了标记分组在HCC临床...
【文章来源】:华北电力大学(北京)北京市 211工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
图2-丨训练集去除离群样本前后IAC分布直方图??
为保证网络构建结果的可靠性,首先需要对数据源进行质量控制,包括芯??片表达数据预处理和异常样本的去除。借助IAC方法去除离群样本并根据样本??聚类树高度衡量去除效果。我们经过三次上述步骤操作,从直方图2-1中看出??为除去离群样本时图像左侧出现一个较长的拖尾,除去离群样本后IAC的平均??值由0.635升至0.668。如图2-2所示样本的聚类树高度由高于0.6降至低于0.4。??经处理后,训练集剩余99个样本,测试集剩余96个样本。??Cluster?Dendrogram?Cluster?Dendrogram??i?^?:丨??萃?涅??as.dist(1?-?IAC)?as.dist(1?-?IAC)??hclust?(*,?"average")?hdust?(*,?"average")??图2-2训练集去除离群样本前后样本聚类树示意图??2.3.2网络构建前提——无尺度网络??加权基因共表达网络需满足无尺度网络条件,定义基因共表达矩阵中的元??素是基因相关系数的加权值,选择权重标准是每个基因网络中包含基因之间的??连接需服从无尺度网络分布(scale-freenetworks)?[33],即连接数为/的概率;?(〇??与f的r次方成反比
为保证网络构建结果的可靠性,首先需要对数据源进行质量控制,包括芯??片表达数据预处理和异常样本的去除。借助IAC方法去除离群样本并根据样本??聚类树高度衡量去除效果。我们经过三次上述步骤操作,从直方图2-1中看出??为除去离群样本时图像左侧出现一个较长的拖尾,除去离群样本后IAC的平均??值由0.635升至0.668。如图2-2所示样本的聚类树高度由高于0.6降至低于0.4。??经处理后,训练集剩余99个样本,测试集剩余96个样本。??Cluster?Dendrogram?Cluster?Dendrogram??i?^?:丨??萃?涅??as.dist(1?-?IAC)?as.dist(1?-?IAC)??hclust?(*,?"average")?hdust?(*,?"average")??图2-2训练集去除离群样本前后样本聚类树示意图??2.3.2网络构建前提——无尺度网络??加权基因共表达网络需满足无尺度网络条件,定义基因共表达矩阵中的元??素是基因相关系数的加权值,选择权重标准是每个基因网络中包含基因之间的??连接需服从无尺度网络分布(scale-freenetworks)?[33],即连接数为/的概率;?(〇??与f的r次方成反比
本文编号:3397755
【文章来源】:华北电力大学(北京)北京市 211工程院校 教育部直属院校
【文章页数】:53 页
【学位级别】:硕士
【部分图文】:
图2-丨训练集去除离群样本前后IAC分布直方图??
为保证网络构建结果的可靠性,首先需要对数据源进行质量控制,包括芯??片表达数据预处理和异常样本的去除。借助IAC方法去除离群样本并根据样本??聚类树高度衡量去除效果。我们经过三次上述步骤操作,从直方图2-1中看出??为除去离群样本时图像左侧出现一个较长的拖尾,除去离群样本后IAC的平均??值由0.635升至0.668。如图2-2所示样本的聚类树高度由高于0.6降至低于0.4。??经处理后,训练集剩余99个样本,测试集剩余96个样本。??Cluster?Dendrogram?Cluster?Dendrogram??i?^?:丨??萃?涅??as.dist(1?-?IAC)?as.dist(1?-?IAC)??hclust?(*,?"average")?hdust?(*,?"average")??图2-2训练集去除离群样本前后样本聚类树示意图??2.3.2网络构建前提——无尺度网络??加权基因共表达网络需满足无尺度网络条件,定义基因共表达矩阵中的元??素是基因相关系数的加权值,选择权重标准是每个基因网络中包含基因之间的??连接需服从无尺度网络分布(scale-freenetworks)?[33],即连接数为/的概率;?(〇??与f的r次方成反比
为保证网络构建结果的可靠性,首先需要对数据源进行质量控制,包括芯??片表达数据预处理和异常样本的去除。借助IAC方法去除离群样本并根据样本??聚类树高度衡量去除效果。我们经过三次上述步骤操作,从直方图2-1中看出??为除去离群样本时图像左侧出现一个较长的拖尾,除去离群样本后IAC的平均??值由0.635升至0.668。如图2-2所示样本的聚类树高度由高于0.6降至低于0.4。??经处理后,训练集剩余99个样本,测试集剩余96个样本。??Cluster?Dendrogram?Cluster?Dendrogram??i?^?:丨??萃?涅??as.dist(1?-?IAC)?as.dist(1?-?IAC)??hclust?(*,?"average")?hdust?(*,?"average")??图2-2训练集去除离群样本前后样本聚类树示意图??2.3.2网络构建前提——无尺度网络??加权基因共表达网络需满足无尺度网络条件,定义基因共表达矩阵中的元??素是基因相关系数的加权值,选择权重标准是每个基因网络中包含基因之间的??连接需服从无尺度网络分布(scale-freenetworks)?[33],即连接数为/的概率;?(〇??与f的r次方成反比
本文编号:3397755
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/3397755.html
最近更新
教材专著