基于最优传输的多中心自闭症谱系障碍诊断
发布时间:2022-01-05 15:30
融合来自多个中心的医学数据能够增加样本数量,有助于研究自闭症谱系障碍(Autism spectrum disorder,ASD)的病理变化。因此,如何有效地利用多中心数据,提高对ASD诊断的准确性受到了越来越多的关注。然而,以往的大部分研究忽略了多中心数据的异质性(如受试者群体和扫描参数的不同),这可能会降低模型在多中心数据上对疾病诊断的性能。为了解决这一问题,提出一种基于联合分布最优传输(Joint distribution optimal transport,JDOT)的领域自适应模型鉴别ASD。选择一个中心作为目标域,其余的中心作为源域,假设两个域的联合特征、标签空间分布之间存在非线性映射,利用最优传输方法交替优化传输矩阵和分类器。结果表明,在多中心静息态功能磁共振成像(resting state functional magnetic resonance imaging,rs-fMRI)数据上,该模型能够有效提高对ASD鉴别的准确性。
【文章来源】:数据采集与处理. 2020,35(03)北大核心CSCD
【文章页数】:9 页
【部分图文】:
JDOT模型
通过Preprocessed Connectomes Project(http://preprocessed-connectomes-project.org)获取由脑连接组分析程序(Configurable pipeline for the analysis of connectome,C-PAC)预处理的rs-fMRI数据。如图2所示,对rs-fMRI图像的预处理过程包括时间层校正、头动校正和空间标准化,并通过干扰回归去除由扫描仪误差和受试者呼吸、心脏搏动引起的信号波动,然后将包含116个预定义感兴趣区域(Regions of interest,ROIs)的解刨学自动标记(Antomical automatic labeling,AAL)图谱对齐到每个图像上,提取每个ROI内的平均响应时间序列。最后通过计算ROI之间的皮尔逊相关系数获得功能连接矩阵,每条边的权值代表两个ROI之间的相关性。由于该矩阵具有对称性,即上三角部分与下三角部分的取值相同,而对角线上的取值仅表示每个ROI与自身的相关性。为了简单起见,选取功能连接矩阵去除对角线的下三角部分,并将其转换成向量作为样本特征。至此,对每一个受试者生成一个6 670维的特征向量。1.2 基于联合分布最优传输的领域自适应方法
在实验中设置分类器f的网络架构包括1个输入层、3个隐含层和1个输出层。输入层的维度为6 670;3个隐含层的维度分别为10,5,5,激活函数为ReLU;输出层的维度为2,激活函数为softmax。损失函数选择交叉熵损失,使用随机梯度下降优化算法更新模型参数。轮流选择1个中心作为目标域,其余的中心作为源域。JDOT模型的Ls,Lt均选择交叉熵损失函数[17]。为方便起见,从源域和目标域随机抽取的mini-batch的大小设置为m=Nt。设模型超参数α,λ的取值范围分别为α={0.001,0.01,0.1,0.5,1},λ={0.001,0.01,0.1,0.5,1}。超参数α,λ的取值对JDOT模型性能的影响见图3。在取值范围内,当α取值为1时,JDOT模型在5个目标中心对ASD和NC分类的平均准确性、敏感性和特异性都达到了较优的水平,且当λ的取值为1时,模型的性能最优。轮流在Leuven,NYU,UCLA,UM和USM中选择1个中心作为目标域,其余的中心作为源域。选择3种用于无监督领域自适应的模型和JDOT模型作横向比较,分别是基于子空间对齐(Subspace alignment,SA)[9]的领域自适应、基于二阶统计量的领域自适应(Correlation alignment,CORAL)[10]、基于最优传输的领域自适应(Optimal transport domain adaptation,OTDA)[12]。其中,SA的子空间维度通过最小化子空间之间的Bregman散度来选择。模型在5个目标中心的分类准确性、敏感性和特异性分别见图4―6,性能评估参数值详见表2。相比之下,JDOT模型取得了最高的平均准确性(68.11%)。在对Leuven,NYU,UM,USM 4个中心鉴别ASD时,JDOT模型均取得了最高的准确性(分别是70.18%,67.07%,68.14%,71.67%);在Leuven,NYU和USM 3个中心,模型均取得了最高的敏感性(分别是68.00%,67.61%,60.53%);在UM,USM两个中心,模型均取得了最高的特异性(分别是69.23%,90.91%)。特别地,在对USM中心鉴别ASD时,模型取得了71.67%的准确性、60.53%的敏感性和90.91%的特异性,均高于其他领域自适应方法。综合上述实验结果,可以说明同时考虑联合特征、标签空间的概率分布,利用最优传输方法,实现源域和目标域之间的非线性映射,能够在一定程度上减少域间差异,提高模型对多中心ASD鉴别的有效性。此外,OTDA模型取得了仅次于JDOT模型的平均准确性(65.82%)和最高的平均敏感性(64.86%),在对UCLA中心鉴别ASD时,模型取得了最高的准确性(67.57%);在UCLA和UM两个中心,模型均取得了最高的敏感性(分别是69.44%,70.83%)。这在一定程度上说明了最优传输方法对减少源域和目标域的数据差异、提高模型性能的有效性。
本文编号:3570602
【文章来源】:数据采集与处理. 2020,35(03)北大核心CSCD
【文章页数】:9 页
【部分图文】:
JDOT模型
通过Preprocessed Connectomes Project(http://preprocessed-connectomes-project.org)获取由脑连接组分析程序(Configurable pipeline for the analysis of connectome,C-PAC)预处理的rs-fMRI数据。如图2所示,对rs-fMRI图像的预处理过程包括时间层校正、头动校正和空间标准化,并通过干扰回归去除由扫描仪误差和受试者呼吸、心脏搏动引起的信号波动,然后将包含116个预定义感兴趣区域(Regions of interest,ROIs)的解刨学自动标记(Antomical automatic labeling,AAL)图谱对齐到每个图像上,提取每个ROI内的平均响应时间序列。最后通过计算ROI之间的皮尔逊相关系数获得功能连接矩阵,每条边的权值代表两个ROI之间的相关性。由于该矩阵具有对称性,即上三角部分与下三角部分的取值相同,而对角线上的取值仅表示每个ROI与自身的相关性。为了简单起见,选取功能连接矩阵去除对角线的下三角部分,并将其转换成向量作为样本特征。至此,对每一个受试者生成一个6 670维的特征向量。1.2 基于联合分布最优传输的领域自适应方法
在实验中设置分类器f的网络架构包括1个输入层、3个隐含层和1个输出层。输入层的维度为6 670;3个隐含层的维度分别为10,5,5,激活函数为ReLU;输出层的维度为2,激活函数为softmax。损失函数选择交叉熵损失,使用随机梯度下降优化算法更新模型参数。轮流选择1个中心作为目标域,其余的中心作为源域。JDOT模型的Ls,Lt均选择交叉熵损失函数[17]。为方便起见,从源域和目标域随机抽取的mini-batch的大小设置为m=Nt。设模型超参数α,λ的取值范围分别为α={0.001,0.01,0.1,0.5,1},λ={0.001,0.01,0.1,0.5,1}。超参数α,λ的取值对JDOT模型性能的影响见图3。在取值范围内,当α取值为1时,JDOT模型在5个目标中心对ASD和NC分类的平均准确性、敏感性和特异性都达到了较优的水平,且当λ的取值为1时,模型的性能最优。轮流在Leuven,NYU,UCLA,UM和USM中选择1个中心作为目标域,其余的中心作为源域。选择3种用于无监督领域自适应的模型和JDOT模型作横向比较,分别是基于子空间对齐(Subspace alignment,SA)[9]的领域自适应、基于二阶统计量的领域自适应(Correlation alignment,CORAL)[10]、基于最优传输的领域自适应(Optimal transport domain adaptation,OTDA)[12]。其中,SA的子空间维度通过最小化子空间之间的Bregman散度来选择。模型在5个目标中心的分类准确性、敏感性和特异性分别见图4―6,性能评估参数值详见表2。相比之下,JDOT模型取得了最高的平均准确性(68.11%)。在对Leuven,NYU,UM,USM 4个中心鉴别ASD时,JDOT模型均取得了最高的准确性(分别是70.18%,67.07%,68.14%,71.67%);在Leuven,NYU和USM 3个中心,模型均取得了最高的敏感性(分别是68.00%,67.61%,60.53%);在UM,USM两个中心,模型均取得了最高的特异性(分别是69.23%,90.91%)。特别地,在对USM中心鉴别ASD时,模型取得了71.67%的准确性、60.53%的敏感性和90.91%的特异性,均高于其他领域自适应方法。综合上述实验结果,可以说明同时考虑联合特征、标签空间的概率分布,利用最优传输方法,实现源域和目标域之间的非线性映射,能够在一定程度上减少域间差异,提高模型对多中心ASD鉴别的有效性。此外,OTDA模型取得了仅次于JDOT模型的平均准确性(65.82%)和最高的平均敏感性(64.86%),在对UCLA中心鉴别ASD时,模型取得了最高的准确性(67.57%);在UCLA和UM两个中心,模型均取得了最高的敏感性(分别是69.44%,70.83%)。这在一定程度上说明了最优传输方法对减少源域和目标域的数据差异、提高模型性能的有效性。
本文编号:3570602
本文链接:https://www.wllwen.com/yixuelunwen/jsb/3570602.html
最近更新
教材专著