多特征融合的肝细胞癌分化等级术前预测方法研究
发布时间:2021-02-25 04:46
肝细胞癌约占原发性肝癌的90%,易发生转移和复发,是第二大与癌症相关的主要死因。肝细胞癌的复发与其分化等级密切相关,术前确定分化等级对选择治疗策略至关重要。当前,病理切片是分级金标准,是有创的诊断手段,可能因为切片不准确造成漏诊。磁共振检查是肝细胞癌患者的常规筛查诊断的影像学方法,具有无创、快速、经济的特点,但其诊断是医生依据经验给出诊断意见,易于出现漏诊和误诊。利用磁共振影像和计算机技术实现肝细胞癌分化等级的无创、快速的辅助诊断,可以降低病理切片给患者带来的痛苦和风险,减少医疗成本。针对肝细胞癌的精准分级问题,本文提出了一种基于影像组学的分级方法。该方法的步骤包括:数据采集,图像预处理,肿瘤分割,特征提取,特征选择和分类模型训练。本文从医院采集了189位肝细胞癌患者的T2加权磁共振影像;为了缓解不同采集设备造成的影像亮度差异,利用局部自适应直方图均衡化算法进行图像预处理;由影像科医生进行肿瘤分割,针对勾画的肿瘤感兴趣区提取出四类影像组学特征;为了获得稳定去冗余的特征,采用了方差过滤、曼-惠特尼秩和检验、Lasso和递归特征消除法进行特征选择;最后,采用SVM、随机森林、XGBoost...
【文章来源】:郑州大学河南省 211工程院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
影像特征
2相关理论与方法12;反之拒绝,接受。(原假设)为两组样本不具有显著性差异,在统计学上P-value小于0.05代表具有显著性差异,本文取为0.05,可以筛选出具有显著性差异的特征。2.3.3最小绝对收缩和选择算子最小绝对收缩和选择算子(Lasso)是嵌入式特征选择的一种,嵌入式特征选择与过滤法不同,嵌入式将特征选择过程与模型训练过程融为一体同步进行,也就是在模型训练过程中完成特征选择的工作,此方法直接针对特定的机器学习算法进行优化,可使模型的分类效果大幅提高,嵌入法示意图如图2.2所示。图2.2嵌入法示意图Lasso是最常采用的嵌入式特征选择算法,它是在线性回归模型的基础上加入了L1正则化构造的,假定数据集,将平方误差作为损失函数得到优化目标为式(2.9)。(2.9)使用L1范数正则化得到优化目标为式(2.10)。.(2.10)加入L1正则化可以使得部分分量为零,既可以防止过拟合,也可以用来进行特征选择,这里的为惩罚项,越大,其解越稀疏,选择得到的特征数量就越少。2.3.4递归特征消除法递归特征消除法(Recursivefeatureelimination,RFE)是包装法(Wrapper)1H1H0H0HUs!!!!1212{(,),(,),,(N,),NiD=xyxyxyy"""!21min()NTiiwiyww=-"#"#"#!211min()||||,0NTiiwiywwlwl=-+>"#"#"#"#w!"ll
2相关理论与方法13的一种,包装法与嵌入法有些相似,都是针对特定模型进行特征选择,但是包装法的特征选择和模型训练并不是同时进行的,包装法特征选择的特征筛选依据是特定分类器的评价指标,这样可以选择出最有利于特定算法性能的特征子集。包装法进行特征子集选择时需要进行多次训练,其训练流程图如图2.3所示。图2.3包装法流程示意图在特征子集的搜索方法上,有穷举法、随机法(LasVegasWrapper,LVM)、前向搜索法,本文实验使用支持向量机(SVM)作为指定分类器,采用前向搜索作为子集更新方法,得到的特征集将与最小绝对收缩和选择算子得到特征集进行对比试验,探究不同的特征选择方法得到的特征子集的分类效果,及其与不同分类算法结合的分类性能对比。2.4机器学习算法Parmar在2015年使用14种特征选择方法和12种分类模型对460名肺癌患者的440种影像特征的预后价值进行了调查,他们发现,不同的特征选择方法会导致大约6%的差异,而分类模型的选择可能会导致放射组学特征的预测值出现高达30%的差异,因此本文在实验部分采用了多种算法进行对比实验,目的是得到最优的模型分类结果。2.4.1支持向量机支持向量机(SupportVectorMachine,SVM)是一种二分类模型,也是目前
本文编号:3050466
【文章来源】:郑州大学河南省 211工程院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
影像特征
2相关理论与方法12;反之拒绝,接受。(原假设)为两组样本不具有显著性差异,在统计学上P-value小于0.05代表具有显著性差异,本文取为0.05,可以筛选出具有显著性差异的特征。2.3.3最小绝对收缩和选择算子最小绝对收缩和选择算子(Lasso)是嵌入式特征选择的一种,嵌入式特征选择与过滤法不同,嵌入式将特征选择过程与模型训练过程融为一体同步进行,也就是在模型训练过程中完成特征选择的工作,此方法直接针对特定的机器学习算法进行优化,可使模型的分类效果大幅提高,嵌入法示意图如图2.2所示。图2.2嵌入法示意图Lasso是最常采用的嵌入式特征选择算法,它是在线性回归模型的基础上加入了L1正则化构造的,假定数据集,将平方误差作为损失函数得到优化目标为式(2.9)。(2.9)使用L1范数正则化得到优化目标为式(2.10)。.(2.10)加入L1正则化可以使得部分分量为零,既可以防止过拟合,也可以用来进行特征选择,这里的为惩罚项,越大,其解越稀疏,选择得到的特征数量就越少。2.3.4递归特征消除法递归特征消除法(Recursivefeatureelimination,RFE)是包装法(Wrapper)1H1H0H0HUs!!!!1212{(,),(,),,(N,),NiD=xyxyxyy"""!21min()NTiiwiyww=-"#"#"#!211min()||||,0NTiiwiywwlwl=-+>"#"#"#"#w!"ll
2相关理论与方法13的一种,包装法与嵌入法有些相似,都是针对特定模型进行特征选择,但是包装法的特征选择和模型训练并不是同时进行的,包装法特征选择的特征筛选依据是特定分类器的评价指标,这样可以选择出最有利于特定算法性能的特征子集。包装法进行特征子集选择时需要进行多次训练,其训练流程图如图2.3所示。图2.3包装法流程示意图在特征子集的搜索方法上,有穷举法、随机法(LasVegasWrapper,LVM)、前向搜索法,本文实验使用支持向量机(SVM)作为指定分类器,采用前向搜索作为子集更新方法,得到的特征集将与最小绝对收缩和选择算子得到特征集进行对比试验,探究不同的特征选择方法得到的特征子集的分类效果,及其与不同分类算法结合的分类性能对比。2.4机器学习算法Parmar在2015年使用14种特征选择方法和12种分类模型对460名肺癌患者的440种影像特征的预后价值进行了调查,他们发现,不同的特征选择方法会导致大约6%的差异,而分类模型的选择可能会导致放射组学特征的预测值出现高达30%的差异,因此本文在实验部分采用了多种算法进行对比实验,目的是得到最优的模型分类结果。2.4.1支持向量机支持向量机(SupportVectorMachine,SVM)是一种二分类模型,也是目前
本文编号:3050466
本文链接:https://www.wllwen.com/yixuelunwen/zlx/3050466.html