基于随机结构稀疏优化的特征选择算法在认知活动的功能磁共振成像数据上的应用

发布时间：2019-11-29 13:43

【摘要】：认知科学是一门探索大脑、心智工作机制的前沿性交叉学科,对认知活动的功能磁共振成像(fMRI)数据的研究能够揭示认知行为在大脑中对应的加工机制,解释和预测人的认知行为。然而在认知fMRI数据的分析中,研究者们通常只关注构建的分类器的分类效果,而忽视了特征选择结果的稳定性。但实际上,fMRI数据具有高维小样本特性,容易发生特征子集的不稳定现象,从而导致特征选择结果不具有可靠性。因此,在fMRI数据的特征学习过程中,特征选择的稳定性甚至比分类性能更重要。本文采用基于随机结构稀疏优化的特征选择算法来分析认知fMRI数据,在稳定性选择的基础上加入约束块子采样过程,并利用认知活动的fMRI数据中体素的局部相关性作为算法的先验结构信息,能够在控制假阳性的同时保持较低的假阴性水平。在此基础上,将随机结构稀疏方法应用到认知活动的两类特征选择问题中:(1)以分类准确率为目标的特征选择问题,即通过改进特征选择方法来提高分类表现。本文通过人脑对情绪识别机制的多体素模式分析实验来研究这类问题。实验利用多种特征选择方法来对面孔情绪数据进行特征选择和分类,结果表明,相对于其他方法,随机结构稀疏算法可以得到最高的分类准确率,而且能够更好地揭示与情绪识别相关的激活脑区。(2)以体素选择准确性为目标的特征选择问题,也就是说重点关注特征选择而非分类准确率。在此类问题中,只用真正差异区域的一小部分体素构建分类器,分类准确率就能够轻松达到很高甚至100%,这时关注分类准确率是没有意义的,而真正应该关注的是特征选择。本文通过人脑对中性面孔的加工机制的多体素模式分析实验和人脑对开心面孔加工机制的多体素模式分析实验来研究这类问题。实验利用多种特征选择方法来对面孔数据进行特征选择,结果显示,相对于其他方法,随机结构稀疏优化算法能够更加全面地检测到面孔加工相关的激活脑区,且检测脑区精准而紧凑,潜在假阳性少,脑区可解释性强。
【图文】：

准确率,面孔,素模,可解释性

31图 4-2 开心脸刺激与中性脸刺激实验各方法得到的脑模式差异图4.6 本章小结本章通过用多体素模式分析方法对开心面孔刺激状态与中性面孔刺激状态间的脑模式差异进行检测分类来研究人脑对面孔情绪识别机制，这也就是以分类准确率为目标的特征选择问题。实验结果表明，配对样本 T 检验并不能检测到任何差异，这也说明了情绪识别是个比较困难的问题。而对于这个比较困难的识别分类问题，RSS、L2SVM、L1SVM、SVM-RFE、Randomized L1 这几种多变量方法的分类准确率普遍不是很高，但是其中 RSS 方法的表现还是比其他方法要好很多，无论是在分类准确率上，还是检测出的与面孔情绪识别任务相关脑区的可解释性上，这归因于 RSS 算法对假阳性的控制和先验结构信息的获取。这同时也说明了好的特征选择方法能够提高分类效果。

最优阈值,区域,检测结果

第五章人脑对中性面孔加工机制的多体素模式分析综合这三个图可知，选择体素个数为 3000 时，RSS 能检测到一部分区域法也能检测到一部分区域，这可能是因为在选择体素为 3000 的情况下，异脑区的体素个数大于 3000，所以各算法只能检测到真实差异脑区中的区。而随着选择的体素个数增加到 6000，RSS 的检测结果明显比其他算此时 RSS 能够检测到全部五个关注的区域，且区域连续性好，杂质区域少低）。L2SVM 和 SVM-RFE 的结果类似，能检测到这五个区域，但是结果些杂质区域的存在。而 L1SVM 和 Randomized L1 的结果一如既往地离散是由于它们过于稀疏却没有组效应造成的。另一方面，选择体素由 3000000后，RSS的检测结果提升力度比其他方法大：RSS的检测结果增加了vm时五个检测到的关键区域都很连续整齐，L2SVM 和 SVM-RFE 的结果也但是杂质区域也增加了，而 L1SVM 和 Randomized L1 的结果提升很小且很离散，解释性很不好。选择体素增加到 9000 时，，所以方法结果的杂质加了，即假阳性比率可能都提高了，在这种情况下，RSS 的杂质区域相法的杂质区域要少。
【学位授予单位】：电子科技大学
【学位级别】：硕士
【学位授予年份】：2017
【分类号】：TP391.41;R445.2

【参考文献】