利用功能连接对脑疾病进行分类和预测

脑功能成像数据,尤其是功能磁共振成像(fMRI)数据已经在很长一段时间来被用来反映大脑的功能整合。大脑功能连接(FC)的改变有望为大脑疾病的分类和预测提供潜在的生物标记。在这篇文章中,进行了对FC预测和分类研究的全面综述,以对现有的大脑功能的处理方法和典型的分类策略进行指导。本文阐述了目前最先进的功能连接分析方法,包括广泛使用的静态功能连接(static functional connectivitySFC)和最近提出的动态功能连接(DFC)ROI、数据驱动的空间网络(spatial ICA)和功能网络连接之间的时间相关性通常被用来从不同的角度反映SFCSFC可以使用滑动窗口框架扩展到DFC,并且通常使用聚类或分解方法提取随时间变化的连通性模式的内在连接状态。

本文还简要总结了无窗口的DFC方法。随后,重点介绍了各种特征选择策略,包括filterwrapperembedded方法。在模型构建方面,介绍了包括传统的分类器以及最近应用的深度学习方法。此外,本文回顾了具有代表性的应用,使用功能磁共振成像数据,对精神分裂症,双相情感障碍,自闭症谱系障碍(ASD),注意缺陷多动障碍(ADHD),老年痴呆症和轻度认知障碍(MCI)等疾病具有显著的分类准确性的研究进行了综述。最后,指出了该领域存在的问题,如诊断标记不准确、可能的特征数量多、验证困难等。并对今后的工作提出了一些建议。

本文和思影公众号之前解读的使用大脑影像数据进行预测和分类研究的文章不同之处在于:本文集中阐述了基于功能数据的脑网络研究方法在对脑疾病进行分类和预测方面的研究,并且对病症相似的精神疾病进行了针对性的对比描述,指出了更加具体的研究问题。同时,本文对SFCDFC框架的综述可以帮助研究者更好地了解当前研究者们常用的FC研究方法并进一步指导研究者进行更为深入的研究。本文发表在Frontiers in Neuroscience杂志。本文与之前思影科技公众号上的文章异曲同工,可结合阅读(直接点击即可浏览)

基于脑影像的精神疾病预测

研究背景

像精神分裂症(SZ)和双相情感障碍(BP)这样的大脑疾病被认为是大脑功能的异常所造成的。虽然精神疾病的诊断是基于临床访谈的症状评分,但目前还没有可用作最终验证的“金标准”。脑功能神经成像技术,包括功能磁共振成像(fMRI) ,正电子发射断层扫描(PET)和脑电图(EEG)已成为研究脑疾病的重要工具。在当前,我们非常希望利用功能性神经成像数据揭示的大脑功能连接可以用来表征大脑功能异常,进而有利于诊断和治疗。在各种不同的模式中,fMRI能够以高空间分辨率对大脑功能进行非侵入性研究,并已广泛用于检测和描述大脑网络或功能关联区域之间的连接。

研究SZBP等疾病之间的功能网络(或连通性)的差异可能为了解其疾病机制提供新的见解。此外,在功能连接测量中识别出的变化可能是有用的生物标记,可以使用机器学习方法对个别患者进行分类。在这篇论文中,论述集中于fMRI数据,但文中提到的一些方法也可以很容易地扩展到其他脑功能成像模式中。

当下,已经有各种各样的方法被提出来用于测量功能磁共振成像数据大脑区域之间的功能连接(FC)。虽然不同的方法有不同的假设和优点,但是详细的回顾对于帮助我们理解这些方法的使用方式是很重要的。如何从大量的测量数据中选择特征作为生物标志物来建立模型对脑功能障碍进行分类或预测是一个重要而具有挑战性的问题。分类和预测是两种分析形式,用于建立模型来区分或预测未来的结果。一般来说,分类是对在扫描时或扫描前已经获得的疾病标签进行分类,而预测是预测未知的疾病标签、未来进展或连续变化。与分类相比,预测更困难,但却是更有希望的临床应用。

在神经影像学的背景下,虽然越来越多的研究倾向于将注意力转移到预测问题上,但以往关于脑障碍的大多数研究都集中在识别用于分类不同群体的神经标记物上。本文主要对脑功能连接的各种测量方法和典型的分类策略进行综述,以期为这一领域的研究提供指导。值得注意的是,分类问题中使用的大部分测量方法和机器学习策略也可以应用或扩展到预测问题中。 

fMRI数据到功能连接

功能连接反映了大脑空间分离区域的系统组织和相互关系。测量和描绘功能连接性的方法起着关键作用,因为使用的测量方法可能会极大地影响生物标志物的识别和个体被试分类和预测的准确性。通常情况下,功能连接被认为在扫描时间(通常是几分钟)内是固定的,而之前的大多数fMRI研究都采用了静态功能连接(SFC)分析。直到最近,越来越多令人兴奋的研究已经证明,将大脑功能连接视为随时间变化的动态,可以成功地揭示正常人类大脑在疾病状态下受到的干扰。图1总结了用于分类/预测问题的主要功能连接性分析方法和可能的连接性特征。

对使用功能连接预测和分类方法的overall总结



1.静态功能连接

1.1模型驱动的种子点间的功能连接分析

在感兴趣的先验区域(ROIs)或体素之间的脑功能连接分析是应用最广泛的模型驱动方法。三个关键步骤包括确定ROI位置和形状或voxel的位置,计算ROI的时间序列,评估不同ROI之间的相关关系或者ROI与全脑其他体素的相关关系。因此,由此产生的功能连接强度反映了所选体素或区域之间的时间序列变化的对应关系。基于ROI的功能连接强度可以很容易地作为分类和预测问题的特征,因为训练集中选择的大脑区域(或体素)可以直接使用在新的/测试集的相应连接特征之间计算。

通过主成分分析(PCA),可以计算出某一区域内具有代表性的体素时间序列为所有体素时间序列的均值或所有体素时间序列的第一个主成分。虽然均值和PCA能在一定程度上降低ROI的代表性时间序列中的噪声效应,但得到的主成分中所表达的功能连接仍然与噪声有关。两个代表性时间序列之间的功能连接主要是通过计算相关性来估计其线性关系,也可以通过互信息方法来评估其非线性关系。相干性估计了频域内的线性关系,并且在特定频率内的连通性可以通过小波分解等方法实现。值得注意的是,不同的度量可能反映不同的连接性含义。除了上述计算步骤外,不同的预处理策略也会影响得到的功能连接强度。是否回归global mean是一个有争议的问题,以及如何去除头动也值得进一步研究。在使用这些流程进行数据分析时,应当谨慎对待这些问题。 

1.2数据驱动的基于 Spatial Functional Network Maps的分析

与模型驱动的方法相比,数据驱动的方法估计功能网络不需要预先定义大脑区域或体素。这些流行的方法包括空间独立成分分析(ICA) ,主成分分析(PCA),和聚类方法。首先是ICA,这是一种广泛使用的方法,目前在识别基于网络的精神疾病(如精神分裂症(SZ))生物标志物方面显示出了巨大的潜力。该方法将个体被试的功能磁共振数据(时间点*体素)分解为多个最大空间独立分量(ICs)的线性组合,其中有意义的ICs可视为脑功能网络。在每个网络中,z分数越大的体素往往具有更高的内部连接(或协同激活),并可以解释为加权种子图。混合矩阵的分解包括ICs的时间序列,其中每个时间序列反映了每个IC的时间序列变化。除了事先不需要先验知识,相对于ROI-based的方法, ICA方法的其他优点包括:(1)从整个大脑同时估计多个网络数据,(2)重叠的成分,可以提供一个空间滤波的基础,以及(3)被试之间成分的自适应性,允许捕获区域内的被试间可变性。

ICA应用于fMRI数据的主要缺点是ICA以任意顺序生成ICs。为了解决这一问题,功能磁共振成像研究通常采用两种策略对多个被试进行研究,以使不同被试的ICs具有可比性。第一种策略是对每个被试分别执行ICA,然后使用主观识别等方法建立各被试之间的ICs对应关系。这些方法对不同主体的多重ICA分解中不同的源分离非常敏感。例如,某一被试检测到的成分可能被分割成多个小的网络成分,包括较小的活动区域,在这样的情况下要建立所有被试间网络成分之间的相关性或者说一致性是非常困难的。

第二种策略通常被称为组ICAGIG-ICA,它对所有的被试数据进行ICA分析,在组水平上被连接起来的时间序列*体素的矩阵中分离出组水平的网络成分,然后再通过spatial-time dual regression的方法对应到每个被试的个体网络成分上。一般来说,拼接多个被试的方法包括空间维度拼接、时间维度拼接和张量形式组织。

每一种方法都可以被认为在达到组水平一致性和捕捉到单个被试可变性之间提供一种平衡。GIG-ICA是一种比较灵活的方法,它通过优化每个被试的多个网络成分的独立性度量来估计特定被试的网络成分,同时保持不同被试之间的网络成分的一致性。GIG-ICA已被证明能够很好地表示单个被试的网络成分,并提供了一种改进的方法来处理组水平的网络成分的一致性。

张量概率ICA方法将原始的多主体fMRI数据沿着一个单独的三维空间堆叠,假设不同的被试有共同的组空间ICs和时间过程,但被试具有特定的loading parameters独立向量分析(Independent vector analysis, IVA)是另一种优化各被试成分之间的独立性和不同被试相应成分之间的相关性的方法。IVA在实现线性相关高斯源和非高斯源的可靠分离方面取得了一些进展。其中,IVA- gl是两种IVA算法的组合,IVA与多元高斯分量向量(IVA- g) IVA与多元拉普拉斯分量向量(IVA- l) ,在复杂性和性能方面提供了一个有力的折衷。

最近有研究对IVAGIG-ICA进行了直接比较,强调了两种方法的优点。对于存在轻微或中度被试间空间变异性的源,GIG-ICA获得的分量精度高于IVA对于所有被试都有一个具有较大的被试间空间变异性的唯一来源的数据集,IVA在唯一来源的组件/时间过程(TC)准确性方面表现得更好,但GIG-ICA总体上仍然比IVA在估计多个被试的共同源方面表现得更好。因此,一个利用IVAGIG-ICA的优点的框架有望实现对一般于被试网络(subject-common)和特定于被试网络(subject-unique)的高精度估计。

数据驱动方法的另一个缺陷是需要选择特定的模型顺序(例如,分解方法中的组件数量或聚类方法中的集群数量),这可能会极大地影响最终的功能网络图。在利用独立分量分析提取功能网络时,通常使用信息论的原理来估计网络成分的数量(如GIFT工具中提供的MDL方法)。由于不同的估计方法会产生不同数量的分量网络,因此考虑模型阶数的影响是非常重要的。此外,很可能单一的模型顺序并不是最好的解决方案,而是可以考虑评估一系列模型顺序的影响,从而对大脑的空间组织进行分级评估。

众所周知,为了进行分类或预测,特征需要在不同的研究对象之间需要具有可比性。在基于ICA的方法中,如何将在训练集中分离出并筛选有效的网络成分应用于未进行独立分量的新的数据或者说测试集上是一个重要的问题。另一种方法是使用空间受限的ICA。后一种方法更为理想,因为单个数据集的结果将为独立性进行优化,并且还将提供适合于每个单独被试的空间和时间特征。用此框架的分类研究可在Du et al. (2015b)中进行查看。 

1.3功能网络连接(FNC)分析

功能网络连接(FNC)分析采用了一种结合模型驱动和数据驱动方法的策略。该框架通常包括两个步骤。它首先对多被试的fMRI数据进行group ICA,形成被试特有的功能网络(ICs表示)及其时间成分(TCs反映)。然后,通过计算任意两个网络之间的连通性测度,如它们经过后处理的TCs之间的Pearson相关性,得到包含所有网络之间连通性强度的连通性矩阵。与基于ROI的方法相似,FNC也反映了大脑不同区域之间的时间连接。

基于ROI的方法与FNC方法的区别在于,在FNC分析中,将数据驱动的方法应用于fMRI数据,生成功能共激活的大脑区域(而在基于ROI的方法中,大脑区域通常是通过先验知识(如大脑图谱)来决定的,而不是使用内部功能磁共振成像数据)。与ICA类似,在FNC方法中,有必要事先确定网络成分的数量。FNC方法通常使用高阶模型(100或更高)来提供更详细的大脑分区。 

1.4其他的功能连接测量方法

除了评估功能连接性(例如相关性)的典型方法之外,还提出了其他有意义的度量方法。     

例如,区域一致性(ReHo)被提议用来反映区域功能连接性(或协同激活),其中肯德尔和谐系数(KCC)用来衡量给定体素的时间序列与其最近邻居的时间序列的相似性。类似的方法还有基于相干度计算的Cohe-ReHo。区域连通性可以作为区分患者和健康对照者的特征。此外,从模型驱动或数据驱动技术中获得功能连接矩阵后,还可以计算图论导出的平均节点强度、聚类系数、全局效率和局部效率等指标。这些基于图论的测量提供了强大的功能,可以整合整个大脑,并可用于分类和预测疾病。 

2. 动态功能连接

上述所有的分析方法都是通过计算相应脑区的时间序列的平均值(例如,用BLOD信号在5分钟或10分钟内计算两个roi之间的Pearson相关性)来估计脑功能连接,并生成一个反映连接强度的静态值。近年来,计算时间分辨率下的大脑不同脑区的连通性度量方法已经逐步发展起来,并且部分研究将其成功应用于从动态连接中识别生物标志物,这引起了研究者广泛的研究兴趣。

在这种分析中,大脑功能的连通性可以在短时间内(比如几十秒)发生变化,而不是随着时间的推移被认为是静态的。这样的结果往往会进一步扩展现有的信息,并避免那种认为大脑活动会随着时间推移而保持静止的强烈假设。动态功能连接(dynamic functional connectivity, DFC)在最近的功能磁共振成像文献中已经成为一个很有前景的课题,但对动态连接理论也有一些批评性的评论。Laumann等人(2017)认为休息状态BOLD测量的相关性在较短的时间尺度上相对稳定,可能不反映认知内容的逐时变化。虽然这个问题还没有完全解决,但是许多新的研究已经显示了动态连接特征在休息期间的行为、情感和认知之间的关系,让我们对其潜在的效用有了信心。此外,由于动态连通性已被证明是识别生物标志物的有用工具,因此,本介绍了一些动态连通性方面的典型方法和应用

2.1 基于滑动窗方法的动态功能连接分析

有许多方法可以用来估计DFC滑动时间窗技术是应用最广泛的技术。通过评估不同时间窗下的功能连接性,可以很容易地扩展现有的静态连接性策略以进行时间维度的分段分析。然后,DFC可以通过测量一个产生多个连接矩阵的滑动窗口中的roi或体素之间的功能连接来进行评估,对不同窗口中的fMRI数据执行ICA(IVA)以生成动态空间网络模式,或对网络的时间序列(即时间序列)进行分段。然后计算时变的FNC。滑动窗口技术也被应用于评价脑磁图和脑电图,得到时变的脑磁图和时变的脑电图。

大脑区域和网络之间的动态连接分析越来越受到人们的关注。进一步研究时变连接模式的各种方法正在进行的工作的一个主题是:通过动态连通的事后分析,可以揭示反映连通区域具体构型的不同连通状态。因此,不同临床人群之间连通性状态的变化可能会提供独特的或额外的生物标志物,而这些标志物是SFC测量无法检测到的。

研究人员已经应用聚类、主成分分析(PCA)Fisher discrimination dictionary learning (FDDL)和空间和时间独立成分分析(ICA)提取连接状态。由于假设的不同,这些方法通常使用不同的模式来估计连接状态。当处理不一定具有理想分布的有噪声数据时,聚类方法可能无法收敛。聚类分析的一个更严重的缺点是,该方法总是可以产生具有任意数量集群的分区,而不管使用的特性是否显示指示聚类的模式。上面提到的基于分解的工作主要关注跨被试的共同的组水平连接状态。还可以使用GIG-ICA来估计组水平和被试水平的连接状态。该方法首先通过分析多个被试的动态连通性来计算组水平连通性状态,然后在组水平连通性状态的约束下,对相互独立的主体特有的连通性状态进行相应的估计。

已经有相当多的工作使用DFC分析来调查精神分裂症谱系障碍和双向情感障碍,以及根据DFC测量对个别患者进行分类。例如,Damaraju et al. (2014)计算了健康对照组和精分病人的动态FNC矩阵,然后将随时间变化的FNC聚类成不同的状态,发现了两组人表现出丘脑超连通性和感觉低连通性存在组间差异的状态。Rashid(2014)也采用聚类的方法对SZ患者和BP患者的动态DFC进行了分析,发现SZ患者比BP被试表现出更多的变化,包括同一连接状态下的hyperhypo连接。Du y.h.(2016b)采用基于roi的方法对82HCs82SZ患者的默认网络(DMN)内的动态连通性进行估计,然后应用K-means提取连通性状态。结果显示,HCs较长时间处于前后脑区连接较强的状态,而SZ患者较长时间处于非连接状态。还有许多其他研究也发现了DFC在发现精神类疾病和健康对照组大脑功能连接特性的差异,这说明DFC在作为潜在的生物标记物方面是存在较大前景的。

此外,大脑活动的时变模式及其与时变大脑连接的关系对我们理解大脑网络和大脑动力学的潜在机制也很重要。最近的一项研究(Fu et al. 2017)开发了一个基于滑动窗口方法的框架,用于表征时变大脑活动,并探索其与时变大脑连接的关联。该框架应用于静息态fMRI数据集,包括151SZ患者和163例年龄和性别匹配的HC表明低频震幅(ALFF)FNC随时间的变化存在相关性,这些关系在SZ中发生了显著变化。 

2.2用于提取动态连接性的无窗口方法

上述滑动时间窗方法已经得到了广泛的应用,并成功地实现了动态连通性的估计。然而,在设定窗口长度的标准上存在明显的限制,尽管之前的研究表明,在捕捉DFC时,窗口长度为3060秒是可行的。如果窗口长度太短,每个窗口中的时间点可能太少,无法生成对连通性强度的鲁棒估计。相反,较长的窗口长度可能会降低功能连接的时间变化,从而阻碍检测有效的连接状态。

为了避免窗口长度的选择问题,最近,研究者们提出了几种基于时频的方法。最近提出的时频分析通过使用多个频率来探索连通性,可以从概念上理解为通过原始时间过程的频率分析来代替观测窗口的滑动。最近,提出了一种新的方法来估计DFC,其主要优点是捕获具有任意频率变化率的动态连接。在基于窗口操作的方法中,可观察的变化速率是由窗口的长度驱动的,但是在这种方法中不需要窗口操作(Yaesoubi et al., 2018)

3.分类和预测       

脑疾病会导致严重的生物损害或使人行为能力衰弱,目前脑疾病已经是全球主要的健康和经济负担。在美国,大脑疾病(如症状、诊断和治疗)通常是通过诊断手册(DSM)来定义的(美国精神病学协会,2013)。也有一些替代方案为脑障碍的分类提供了标准方案,例如世界卫生组织(世卫组织)制定的ICD-10精神和行为障碍分类。然而,随着时间的推移,新的知识不断增加,导致了诊断和疾病分类的变化(例如,一些是无效的,一些是变化的,一些是新的出现)。此外,许多精神疾病的诊断主要基于症状,而不是生理标准。最近,人们开始关注研究各种疾病的变化性,并关注持续评估健康和疾病的方法,例如希望能研究出领域标准(RDoC)。在此背景下,有越来越多的研究倾向于寻找到特定的生物标记物。大脑功能的连通性在寻找许多大脑疾病的标记方面一直被研究者所青睐。在接下来的文章中,作者将回顾一些在功能磁共振成像功能连接脑障碍研究中常用的特征选择和分类(或预测)策略。比较了特征选择方法和分类器的几个关键方面,讨论了它们的优缺点。   

3.1特征选择策略

fMRI数据的特性使得特征选择在分类和预测中尤为重要(Van Schooten et al.2014)。即使只评估定义的ROI之间的连接性,功能连接矩阵的维度也很大。如果在体素之间计算功能连接性,那么特性的数量就会增加(可能有数百万个特性)。与特定大脑疾病相关的功能性连接通常集中在所有可能的连接/关联的一小部分。在这种情况下,如果将所有的功能连接都用作分类器中的特征,这会导致过度拟合问题,因为算法试图使分类器匹配每个特征,甚至不相关的特征。如果分类器模型过度拟合到训练样本上,则可能会对不在训练集上的样本产生不良影响,导致分类性能不理想。另一个问题是功能连接可能为分类提供大量的冗余信息。使用所有连接作为带有冗余信息的特性可能会损害分类的结果。考虑到这一点,重要的是要纳入良好的特征选择策略,以确定适当的功能连接特征。表1总结了不同特征选择方法的特性。

特征选择的主要方法的特性和优缺点汇总

3.1.1 Filter方法(筛选过滤方法,避免冗余特征)

广泛应用的特征选择策略是基于过滤的方法,特征选择独立于分类器/模型构建。他们使用数据集的一般特征,并为特征分配权重,从这些特征中选择了许多得分最高的特征。一个好的滤波方法是对自由裁量权敏感,从而抑制最无用的特征。最常用的过滤方法是使用组级统计测试。一般来说,首先使用不同的统计检验如T检验、Welchs T检验和ranksum-test来识别具有组间差异的功能连接,然后将这些功能连接作为分类方法的输入特征。这种策略的一个主要问题是,有时使用整个数据来研究组间的差异。也就是说,测试样本的标签信息被用来进行特征选择,这会导致分类结果的偏倚。另一个问题是,特征通常是基于它们的p值来选择的。然而,在群体比较中,p值较小的功能连接不一定反映出具有最大辨别能力的功能连接。我们组之前的一项研究表明,特征可以有不同的分布,但对不同的群组具有不同的敏感度。这类特征可能具有较大的p值统计检验,但具有良好的分类性能。

还有其他的过滤方法用于大脑疾病的分类。Fisher评分是一种单变量特征选择算法,用于确定两组等概率特征的区分能力。基于相关的特征选择(correlation-based-feature selection, CFS)是一种简单的算法,它基于一个假设,即好的特征子集包含与分类高度相关的特征。基于RELIEF的算法是另一大类过滤方法,它根据特征值在实例之间的区分程度来估计特征的得分。这些方法不依赖于启发式算法,在低阶多项式时间内运行,并且对特征交互具有抗噪声和鲁棒性,适用于二分类或连续数据。特征选择也采用了最小冗余、最大关联(mRMR)算法。该方法利用每个特征的预测能力和特征之间的互信息对最相关的特征进行排序。与穷举搜索相比,mRMR可以获得令人满意的结果,而不会增加对特性列表进行排序的时间成本。

基于过滤的特征选择方法的主要优点是计算时间的有效性和对过拟合的鲁棒性。然而,过滤方法也有一些缺点。首先,过滤方法选择的特征没有经过优化以适应任何特定的分类器。其次,一些过滤方法由于忽略了特征之间的关系而倾向于选择冗余特征。 

3.1.2 Wrapper方法和 Embedded 方法

通常,wrapper方法使用分类器或预测模型对特性进行排序。这类方法评估了不同特征组合的分类性能,并试图识别出能够提供最大分辨能力的特征的最优子集。由于可能的特征组合的数量随着特征数量的增加呈指数级增长,可选择的启发式和终止条件通常用于这类方法,以避免特征的选择超出计算机的处理能力。各种wrapper方法已被应用于大脑疾病分类研究。递归特征消除(RFE)是最常用的一种方法,它通过递归地考虑越来越小的特征组合来选择特征。该算法利用特征的初始集训练分类器,并根据特征的重要性对特征进行排序。然后丢弃最不重要的特性,然后使用剩下的特性递归地重复这个过程,直到选择了预期数量的特性。另一种广泛使用的wrapper方法是遗传算法(GA)家族,它使用二进制编码和特定的变化来选择特征。该算法是以支持向量机分类器的识别率作为特征选择的可分性判断依据。在遗传算法中,对所选择的特征用[0,1]二进制串来初始化,由于二进制数{01}是等概率出现的,所以最优特征个数的期望是原始特征个数的一半。要进一步减少特征个数,则可以让二进制数{01}以不等概率出现,以a个特征中选择b个特征为例,使得在a位二进制串中1出现的概率为b/ab/a 通过不断重复这个过程,并且使用交叉子集的方法进行遗传操作,当遗传操作到达设定的最大迭代次数时,算法结束。

wrapper方法倾向于选择性能比筛选器方法更好的特性,并且可以为特定类型的分类器提供最佳特性选择。然而,wrapper方法也有两个主要缺点。首先,如果观察值不大,wrapper方法可能会过度拟合。其次,wrapper方法的计算成本要大得多,因为它们需要递归地创建分类器。

将分类和特征选择结合到决策过程中的Embedded 方法也被应用于分类。Embedded 方法类似于wrapper方法,因为它们都将特征选择合并到分类器构建过程中。但是,wrapper方法使用机器学习方法来测量特征子集的质量,而不考虑关于分类或回归函数的具体结构的知识;因此,他们可以与任何机器学习方法结合。在Embedded方法中,学习部分和特征选择部分是不可分割的。在Embedded 方法的学习过程中,使用了一个内在的模型构建度量,其中的特征选择是特定于给定的机器学习模型的。Embedded 方法的一个常见类别是使用正则化惩罚来增强特征的稀疏性,以识别具有更强区分能力的特征。最常用的正则化惩罚Embedded方法是LASSO方法。

LASSO方法建立了一个线性模型,并使用L1范数来惩罚回归权重。将权值压缩到零,最后选择权值非零的特征。岭回归是另一种用于特征选择的Embedded 方法。与LASSO方法类似,岭回归通过引入惩罚项来缩小回归权值。然而,岭回归惩罚的表现不同于LASSO回归中的惩罚系数。与LASSO相比,岭回归更有可能选择相关性高的特征,并提供更好的分类性能。弹性网络算法LASSO算法的扩展。该方法结合了LASSO和岭回归方法,克服了LASSO在特征数选择和特征选择稳定性方面的局限性。因为Embedded方法选择特定于分类器的特性,所以它们更快,计算代价更小。 

3.2 预测和分类的机器学习模型

3.2.1 传统机器学习模型

各种各样的分类器已被应用于大脑疾病的分类。支持向量机(SVM)是目前最流行的方法(这已经在多篇利用脑网络和脑影像数据进行分类和预测的综述被提及,可以说是一种共识了)。SVM是一种有监督学习分类器,其学习算法用于分类和回归。标准支持向量机是一种二元分类器,它推广了最佳分离超平面以更好地分离不同组的数据。支持向量机的基本思想是找到与另一个类的观测值最接近的一个类的观测值。超平面的绘制方式是使这些观察值之间的距离最大化,以便超平面可以将观察值分隔成不同的边。由于支持向量机分类器使用了一个“slack variable”,因此支持向量机允许不同组之间的重叠。SVM分类器不需要任何假设,是一种非常灵活的方法。然而,与其他传统分类器相比,SVM的结果也难以解释。原SVM分类器为线性分类器。通过将不同的核函数合并到最大边缘超平面,SVM可以成为非线性分类器。核函数将原特征空间转化为高维特征空间,使算法能够在新的特征空间中拟合最大边缘超平面。支持向量机有几种常用核函数,如多项式核函数、sigmoid核函数和高斯RBF核函数。核函数的选择对于构建成功的基于SVM的分类器至关重要。根据特征的不同,不同类型的核适用于不同的研究。不同核支持向量机有不同的超参数需要优化。例如,线性核支持向量机只有一个超参数需要调整,称为soft margin此外,使用非线性内核的支持向量机方法还有一个或多个超参数需要调优。超参数的优化通常基于对预先提供的备选值的测试。这些参数对支持向量机的分类性能和分类精度有重要影响。

线性判别分析(Linear discriminant analysis, LDA)是另一种广泛使用的分类器,它将特征投射到低维空间中,在低维空间中,不同组的数据可以最大限度地分离。LDAFisher线性判别式的推广,它基于寻找将两个组分开的特征的线性组合的概念。LDA通过连续自变量的值来解释组标签。通过将数据投影到低维空间,LDA可以避免过拟合问题,降低总体的计算成本。LDA与主成分分析(PCA)非常相似。主成分分析用于寻找使数据方差最大的轴,而LDA用于寻找使多个组之间的距离最大的轴。LDA有两个主要限制。首先,LDA要求在数据组中假设一个共同的协方差结构,这在实际应用中非常罕见。其次,虽然LDA可以用于多类分类问题,但它更适合于两类问题。

3.2.1 深度学习模型

深度学习方法在各个领域引起了越来越多的研究兴趣,也被应用于大脑疾病的分类。与传统的机器学习方法相比,深度学习方法能够通过使用具有不同复杂程度的层次结构,直接从原始数据中学习最优表示。深度学习方法将非线性转换应用于原始数据,这些转换提供了具有更高抽象层次的隐藏特征,这将在较低层次上对原始输入数据空间具有更多的信息性。这一优点不仅有助于自动解决特征选择的困难,而且与传统分类器相比能够提高分类性能。

人工神经网络(ANN)是使用功能磁共振成像数据对病人进行分类的常用方法。ANN通过构建人工神经元和神经元之间的连接层来学习从例子中完成任务。例如,在大脑疾病分类中,它通过分析被标记为健康或疾病的训练对象,并利用这些信息来对其他个体进行分类,从而识别出患有大脑疾病的个体。自动编码器是一种广泛用于大脑疾病分类的人工神经网络。该方法包括两个阶段。第一阶段是编码,它将输入映射到一个隐藏的表示。第二个阶段是解码,它将隐藏的表示映射回来,以获得尽可能接近输入的输出。通过在训练过程中对隐藏层施加稀疏,自动编码器可以从输入数据中学习有用的结构。这允许输入的稀疏表示,这在分类任务的预训练中非常有用。

深度信念网络(Deep belief network, DBN)是另一类利用功能磁共振成像(fMRI)数据对神经网络进行分类的神经网络,它由多层潜在变量及其之间的联系构成。DBN的独特之处在于它允许一些层之间的无向连接,这些层称为受限制的Boltzmann machine(RBM,即玻尔兹曼机)DBN通常使用无监督学习算法(如梯度下降算法)来训练这些层。因此,DBN不是使用确定性函数和重构误差(如自动编码器),而是使用最大似然估计进行预训练。

深度学习在分类中的应用面临几个关键问题。第一个挑战是时间和计算资源的数量。层数、节点数和每个节点的功能通常是人为确定的,但也提出了一些自动优化策略。在深度学习方法中需要估计大量的参数,这使得计算资源大大增加。第二个挑战是使用深度学习方法时潜在的过度拟合问题。由于fMRI数据的特征维度通常非常大,而样本数量相对较少,因此深度学习方法会倾向于学习数据中特定或局限于研究的特征。尽管已经开发了几种方法来解决这个问题,例如正则化策略和特征的预先选择(即这些方法还引入了其他关键问题,如如何引入适当的稀疏性,如何选择最优的特征子集等)。第三个挑战是从深度学习方法中获得的结果的可解释性。深度学习方法通常被视为一个黑盒,它对原始特性使用连续的非线性转换,将它们映射到具有更高抽象级别的另一个空间。虽然模型信息,如隐含层中的节点和它们之间的联系,已经被证明对区分大脑疾病是有用的,但是很难将它们回溯到原始的特征空间,这将导致结果的解释问题。由于这些问题,深度学习方法可能在大脑疾病的分类中很有效,但不能提供关于潜在的神经解剖学或神经功能改变的任何信息。这将会导致在临床应用方面的困难。虽然这些问题仍然没有解决,但深度学习方法仍有很大的潜力来提高对大脑疾病的诊断,并可能成为有希望的工具,以推进大脑疾病中受损的大脑认知功能的知识。表2总结了不同分类器模型的特性。
传统机器学习和深度学习模型总结




4.脑功能连接在分类脑疾病方面的应用

1990年到2017年,超过200篇论文使用功能连接特征单独或包括功能连接在内的多模态特征对大脑疾病进行分类或预测。在本节中,作者主要集中于研究如何将患有脑部疾病的患者与健康对照者(即脑病患者)进行分类(即二分类问题)。也包括一些区分多种不同的疾病的工作(即多类分类问题)。本文主要总结的研究有关精神分裂症、双相情感障碍,自闭症谱系障碍(ASD),注意缺陷多动障碍(ADHD),阿尔茨海默病(AD)和轻度认知障碍(MCI),其中一些疾病有非常相似的症状和共同的大脑的变化,可以混淆诊断,如精分和双相情感障碍、孤独症和多动症,ADMCI。虽然其他脑障碍,如抑郁症也得到大量关注,但本文的主要目标是提供一个概述,即大脑功能连接特征在多大程度上被用来分类脑障碍,以及分类框架工作得有多好。图2总结了报告其分类准确性的现有应用研究。在性能方面,这些研究的平均分类准确率在80%左右,AD/MCI相关研究的准确率最高。

    

使用功能脑网络预测或分类疾病的研究总汇

在这些研究中,显示出这样一些趋势:从单独使用连接性特性(例如ICA的空间映射和功能连接性)到使用复杂的网络属性(例如基于图论的度量)的研究;从使用静态连接度量到使用动态连接度量;从单一成像模式到多模式特征的使用;从使用传统分类器到使用更复杂的深度学习分类器;从对健康对照组的病人进行分类到对多组病人进行分类。在下面的每个小节中,作者将重点介绍一些典型的研究,以更详细地突出这些潜在的趋势。 

4.1精分和双相情感障碍

精神分裂症是一种严重的慢性大脑精神障碍,其症状包括妄想、思维紊乱、幻觉和社交问题(Endicott and Spitzer, 1978;Kay et al., 1987; Calhoun et al., 2008; Fu et al., 2017).。虽然精神分裂症只影响了全世界1%的人口,但其症状对患病人群造成极大的伤害。精神分裂症的症状分为三种类型:积极的,消极的和认知的,这些症状通常开始于青年期,并持续很长一段时间(美国精神病学协会,2013)。双相情感障碍是一种以躁狂症和抑郁症交替发作为特征的情绪障碍。双相情感障碍包括四种基本亚型,它们都涉及情绪、精力和活动水平的明显变化。双相情感障碍的根本原因尚不清楚,但众所周知,环境和遗传因素都有影响。精神分裂症和双相情感障碍都没有标准的临床测试。因此,探讨利用神经影像学资料自动诊断这两种脑功能障碍的可能性具有重要意义。

许多研究基于功能磁共振成像的功能连接来区分SZHC。基于ICA的空间成分网络是分类中最常用的功能特征之一。例如,Du等人使用ICA提取个体空间成分作为初始特征,然后将两层特征识别方案与核主成分分析(KPCA)Fisher s线性判别分析(FLD)相结合用于SZ分类(Du et al.2012)。通过使用多特征结合的方法,他们在听觉oddball任务中获得了98%的分类准确率,在静息态下获得了93%的准确率。

基于ROI的功能连接网络也常常被用于分类任务。(AAL模板是分类中最常用的脑图谱,尽管也使用一些其他地脑图谱。除了这些简单的连通性特征(组件空间图和功能连通性),高层次的网络组织也被认为是重要的生物标志物。Bassett et al.(2012)90AAL区域的时间源间的功能连通作为支持向量机的输入特征,在构建图数据时采用连通分量的大小作为支持向量机的输入特征,分类准确率高达75%,灵敏度高达85%。研究还将功能连通性与其他模式的其他特征相结合,以区分SZHCYang等人提出了一种混合机器学习方法,利用功能磁共振成像和单核苷酸多态性(SNP)数据的特征对SZsHC进行分类。他们将三种模型(SNPsvoxel水平功能连接图和ICA网络成分图)合并到一个模块中,使用多数投票算法做出最终决定。通过留一交叉验证,他们证明该框架可以提供更高的分类精度(合计:87%;SNP: 74%,体素:83%ICA: 83%)

在第24届信号处理机器学习竞赛(MLSP) (Silva et al.2014)中,参与者被要求使用多模态特征自动区分69名精神分裂症患者和75名健康对照组,包括使用功能磁共振成像数据的FNC特征和使用结构MRI数据的ICA成分。利用AUC估计模型性能。所有参赛作品的总AUC都不能达到0.9或更高,所有2087个参赛作品的AUC中值接近0.75。通过先验分布的高斯过程(GP)分类器,通过概率变换进行尺度变换,最终获得了总AUC 0.89

      功能连接的时间动力学在许多神经影像学研究中被广泛观察,并被认为反映了神经活动。Cetin et al. (2016)使用使用静态FNC和动态FNC尝试利用fmriMEG数据区分精神分裂症患者与健康对照组。他们使用留一交叉验证方法来检验分类的准确性,研究结果表明,单独使用fMRI数据和MEG不如结合使用两者数据的分类效果(正确率最高达85.71%))更好,并且dFNC结合两个模态数据,分类效果提升更多(正确率最高达90.11%)。

近年来,也有越来越多的研究证明了在分类中使用深度学习的好处。Kim et al.(2016)采用L1-norm正则化方法进行特征选择,使用具有多个隐含层的深度神经网络(deep neural network, DNN)作为分类器。结果表明,DNN的两组分类准确率约为86%,明显优于SVM的分类准确率。

基于功能连接的SZBP患者在个体层面的分类特征也得到了研究(Calhoun et al., 2008; Arribas et al., 2010; Rashid et al.,2016)。在之前的研究(Calhoun et al. 2008)中,使用颞叶和默认网络的ICA成分构建特征,在留一交叉验证框架中,该方法在个体层面对精神分裂症和双相情感障碍患者进行分类,准确率约为83 - 95%Arribas等人(2010)提出了一种利用脑成像数据对健康对照者、双相情感障碍患者和精神分裂症患者进行自动分类的有监督方法。以GIG-ICA的每个被试的网络成分图作为特征,进行两步降维:首先进行t检验筛选,然后使用奇异值分解方法。将约简后的特征作为概率贝叶斯分类器的输入。实验结果表明,三向正确分类率(CCR)平均在70 - 72%的范围内,证明他们提出的方法是精神分裂症和双相情感障碍患者分类分析的可靠框架。最近,功能连接的时变模式被用来区分SZBP患者。Rashid等人基于精神分裂症、躁郁症和健康被试的静态和动态FNC提出了一个分类框架(Rashid et al.2016)。通过交叉验证框架比较静态和动态连接性特征的分类性能。总体结果显示,动态FNC(分类准确率为84.28%)在预测准确率方面显著优于静态FNC(分类准确率为59.12%)说明功能连接中的动态模式可能比SFC提供更清晰、更丰富的信息。

精分、抑郁症和双相情感障碍有重叠的临床症状,因此在临床诊断中很难区分它们。Du等人使用的静息态fMRI数据利用GIG-ICA从特定被试的大脑网络中识别成分,然后将健康对照者、SZ患者、BPP患者、有躁狂发作的分裂情感性障碍患者(SADM)以及完全有抑郁发作的分裂情感性障碍患者(SADD)进行分类(Du et al., 2015b)。该文章使用选定的经典ICA网络成分作为特征,使用多分类SVM模型(五分类),利用RFE进行特征筛选。对于测试集的每个对象,在训练集得到的组水平网络的指导下,计算出特定于被试的网络,然后将相应的特征输入到使用原始样本训练的分类器中。结果表明,有分类贡献的脑区主要包括额叶、顶叶、楔前叶、扣带、辅助运动区、小脑、岛叶和眶上皮层,这些区域可以为新进入模型的数据提供68.75%的分类准确率。在功能网络测度的基础上,采用层次聚类和映射方法进一步研究了这些群体之间的关系。有趣的是,层次聚类的结果表明,使用网络测度,SADM组和SADD组彼此最接近;与其他组比较,SAD组与SZ组更为相似;与其他患者相比,BP组与HC组更接近。这些结果提供了除了疾病分离之外的一个有趣的观点,这些症状相关的疾病之间的关系是不同。该研究的框架和结果(Du et al. 2015b)分别如图34所示。

利用GIG-ICA为特征使用多分类SVMHCSZSADSADMSADD分类的机器学习框架

利用GIG-ICA为特征使用多分类SVMHCSZSADSADMSADD分类的网络成分层次聚类结果

 

4.2自闭症谱系障碍和注意缺陷多动症

ASD是一种复杂的神经发育障碍,会造成广泛的临床症状、技能受损和残疾程度,影响一个人如何与他人互动、沟通和学习(美国精神病学协会,2013)。这种疾病开始于童年早期,并持续一生。据估计,ASD在美国的患病率为1:68,而治疗一位患有自闭症谱系障碍的美国人一生的花费已经超过了100万美元。自闭症的确切病因尚不清楚,可能是由遗传、大脑结构和功能、发育和环境因素引起的。有效的治疗和服务可以缓解症状,改善生活。

然而,ASD是一种异质性很严重的情况,这意味着ASD患者没有长期相同的特征,他们的特定症状可能随着发展而改变(Lord et al.2000)。因此,ASD的诊断和定义仍是一个具有挑战性的问题。儿童在5岁和6岁之前被诊断为自闭症谱系障碍,这是很常见的,那时已经来不及进行有效的治疗。

ADHD是另一种常见的影响儿童的脑部疾病,其症状与自闭症有重叠和混淆之处。患有ADHD的儿童可能会注意力不集中、多动或冲动,从而影响到学校和家庭生活。多动症在男孩中比女孩更常见,通常在上学初期就被诊断出来,并一直持续到成年。据估计,有3%的学龄儿童患有多动症。多动症的病因尚不清楚,研究人员证实,遗传、化学失衡、大脑变化或损伤、营养不良等因素可能是导致多动症的原因。目前,ADHD的诊断主要基于DSM中描述的行为症状。然而,DSM可能具有误导性,因为没有有效的ADHD测试,而ADHD有很高的共病率,这可能会混淆。由于ASDADHD的诊断困难,越来越多的研究使用神经成像数据来开发方法,试图更好地描述和预测这些大脑疾病。在接下来的章节中,作者回顾了使用功能连接特征对ASDADHD进行分类的研究。

使用功能连接作为特征对ASD进行分类的研究始于2011年左右。Anderson等人计算了静息态数据灰质的7266 ROI的功能连通性,使用一种阈值化的分类模型和留一交叉验证对健康被试和ASD病人进行了分类,在20岁以下的数据集中获得了89%的正确率,在所有年龄段数据集中获得了79%正确率(Anderson et al., 2011)Murdaugh et al. 使用基于种子的功能连接(种子:内侧前额叶皮层、后扣带皮层和角状回)以及全脑功能连接,在logistic回归分类器中区分自闭症谱系障碍和对照组,发现全脑和基于种子的功能连接矩阵作为特征都可以达到96.3%的准确性(Murdaugh et al.,2012)

自闭症脑成像数据交换(简称“ABIDE)计划收集了来自世界各地实验室的功能性和结构性脑成像数据,以加速对自闭症谱系障碍的神经基础的理解(http://fcon_1000.projects.nitrc.org/indi/abide/)。Plitt et al. 使用178名年龄和智商匹配的被试,计算了三组不同ROI之间的功能连接。他们在logistic回归和SVM分类器中都使用RFE进行特征选择,总体分类准确率为76.7%(Plitt et al.,2015).

ASD的分类研究中,功能连通性也结合了其他模式的特征。Deshpande等人从涉及物体和意图因果关系的实验中确定了18个激活区域,并计算了每个被试的激活脑区的因果连接权重、功能磁共振成像的功能连接以及从DTI数据中获得的分数各向异性(FA)。将这些特征用于基于递归聚类消除的SVM分类器中,最终达到了最大分类准确率95.9%。近年来,深度学习分类器在ASD分类中得到了广泛的应用。Iidaka选取了更多的被试(312名患有自闭症谱系障碍的被试和328名对照组被试)并将90roi之间的静息态功能连接作为概率神经网络(PNN)的输入进行分类。PNN获得了90%准确率的分类结果(Iidaka, 2015).

也有大量的工作使用功能连接来分类多动症和健康控制。Zhu et al. (2008)首次使用fMRIReHo构建了基于PCAFisher判别分析(PC-FDA)的线性分类器,结果显示使用留一交叉验证的分类准确率达85%Wang et al.(2013)从静息态fMRI信号中提取ReHo map,作为SVM的输入。他们根据k折交叉验证选择特征,并表明优化后的模型总准确率达到80%

基于图论的功能连接测量正在成为区分ADHD和健康对照组的重要特征(Fair et al.2013;Dey et al.2014)Fair等人利用基于功能连接网络的节点强度成功地将ADHD (Combined (ADHD- c)inattention (ADHD- i)两种亚型与健康对照组进行分类,准确率高达82.7% (Fair et al.2013)。这种图论的测量指标也能够将三组群组分开,在3组分类中,总体准确率达到69.2%。现有的研究也使用功能连接测量和其他功能磁共振成像特征或其他模态特征来对多动症进行分类的(Colby et al., 2012; Dai D. et al., 2012;Sato et al., 2012; Anderson A. et al., 2014).。例如,Colby等将结构MRI的形态学测量指标与功能连接等功能特征、fMRI的图论指标结合起来作为SVM的输入特征,并使用RFE算法进行特征选择。使用这种SVM-RFE分类器,他们能够以55%的准确率对ADHD的诊断进行分类(Colby et al., 2012).

研究表明,ASDADHD在大脑功能上既有共同的异常,也有特定障碍的脑功能异常(Christakou et al. 2013;Chantiluke等人,2014)。然而,很少有研究使用功能连通性特征来区分ASDADHD,功能连通性是否可以作为区分这两种大脑疾病的强大生物标志物仍是一个具有挑战性的问题。 

4.3阿尔兹海默症症和轻度认知障碍障碍

MCI是一种综合征,它会导致比预期年龄更大的记忆丧失。据报道,65岁以上的成年人中,约有3.19%患有轻度认知障碍。MCI的症状不像AD那么严重,因此MCI患者可以进行正常的日常活动。MCI有几种亚型,其中一种亚型称为遗忘型MCI,与记忆丧失有关,有进展为AD的高风险。研究表明,大脑记忆区域在MCIAD中均受损,而认知区域仅在AD中受损。虽然不同文献对MCIAD的发展率有很大差异,但研究发现这种发展并不是不可避免的,但健忘症MCI仍被认为是AD的前身。

阿尔茨海默症是最常见的痴呆类型,会导致记忆、思维和行为方面的问题。AD65岁以上的人群中越来越普遍,AD作为一种公共健康问题的重要性变得显而易见。据估计,每小时有60例新发病例,到2050年,这一数字将翻一番。从2000年到2013年,由AD导致的死亡显著增加了71%,使AD成为美国第六大死亡原因。

传统上,AD的诊断主要依赖于临床检查和对个体认知和行为的评价。改善ADMCI患者的诊断可能有助于在疾病进展的早期识别疾病,这可能对开发这些疾病的治疗至关重要。考虑到ADMCI对健康的严重影响以及它们对护理者和社会的整体影响,已经有大量的研究使用神经影像学特征,特别是功能核磁共振成像中的功能连接来诊断这些大脑疾病。Wang等人基于伪费雪线性判别分析(Pseudo-Fisher Linear discriminative Analysis, pFLDA)提出了AD的判别模型(Wang et al., 2006).。他们利用静息态下大脑中两个反相关网络的相关/反相关系数作为分类模型的特征,得到CCR83%Challis等人使用具有线性和非线性协方差函数的贝叶斯高斯过程逻辑回归(GP-LR)模型对ADMCI进行分类,通过使用功能连接作为特征,他们对分类MCI和健康对照组实现了75%的准确性,而对MCI病人和AD病人的分类达到了97%的准确(Challis et al., 2015)。不仅功能连接本身,而且其扩展或相关的指标,如图论指标,已被用作ADMCI诊断的特征。Jie等人开发了一个新的框架,集成多个功能连接属性,以改善MCI的诊断(Jie et al., 2014)他们采用多核学习(MKL)技术,利用两种不同类型的核分别量化局部连通系数和全局连通系数。该方法的分类准确率达到91.9%明显优于以往单一连通指标的分类方法。除此以外,还有利用多模态脑影像数据结合功能连接作为模型输入特征的研究,也获得了较好的分类结果。

人类大脑是一个动态系统,具有非平稳的神经活动和快速变化的神经相互作用。越来越多的证据表明,功能连接性不是静态的,而是随时间发生显著变化。已有研究使用功能连接的动态模式作为痴呆症及其前期阶段的分类特征。MCI研究使用滑动窗口方法估计灰质之间DFC的动态变化和白质上功能相信的动态张量变化,并将它们作为特征对MCI对象进行分类(Chen X. et al.2017)。他们发现动态功能连接特征显著提高了分类性能,表明灰质和白质中的功能信息是互补的(编者注:关于白质上Bold效应的研究,有一种叫做FCTfunctional correlation tensor,类似于在diffusion成像中利用的张量成像,是一种通过计算白质上Bold信号相关然后估计其张量关系的方法)。

虽然绝大多数ADMCI分类研究使用支持向量机和LDA等传统分类器,但越来越多的研究已经考虑到深度学习分类器相对于传统分类器的优势,并开始在ADMCI分类中使用深度学习模型。Meszlenyi等人描述了一种用于功能连接分类的卷积神经网络,称为connect -convolutional neural network (CCNN) (Meszlenyi et al.2017)。通过对CCNN模型在仿真数据集和公共MCI数据集上的性能测试,表明所开发的模型能够区分不同组的对象。他们的结果也证明了CCNN模型可以将不同的功能连接度量组合到分类中,这种组合比使用单一度量的其他分类器具有更好的性能。

5. 在确定脑障碍的生物标记物和个体的分类任务上的挑战和困难       

5.1 缺少诊断的“金标准”

分析功能磁共振成像的数据,以确定生物标志物和诊断大脑疾病的最终目标是有希望的,但具有很多挑战性,因为事实是,目前的诊断分类本身作为模型之前的指导可能是不准确的,需要进一步细化。到目前为止,对于复杂的诊断还没有金标准。诊断仅由可观察到的症状决定,而访谈和病史是影响诊断的主要因素。例如,在临床诊断中,SZBPSAD等临床症状重叠的患者往往难以区分。

SZ是一种精神疾病,特征是知觉改变,失去动力和判断力,以及社会认知障碍。BP是一种情绪紊乱,表现为躁狂和抑郁交替发作。当符合SZ的症状标准,并且在相同的连续时间内出现重度抑郁、躁狂或混合发作时,就诊断为SAD。事实上,自闭症谱系障碍和SZ谱系障碍之间也存在社交退缩和沟通障碍等重叠症状。ASD是一种神经发育障碍,其特征是一系列的异常行为,包括跨多种背景的社交和互动方面的持续缺陷。多动症的特征是持续的注意力不集中和/或多动-冲动,干扰认知功能或发展。研究工作还表明,自闭症谱系障碍和多动症的症状重叠率很高。因此,这些脑功能障碍症状的相似性给临床诊断带来了困难。

大多数现有的fMRI研究(Calhoun et al., 2009a; Koike et al., 2013; Du et al., 2017c),,都应用统计分析来调查多组间的差异,或使用监督学习的方法来探索有效的个体诊断和治疗的生物标志物,这些都依赖于诊断标记。这些研究的假设是:(1)诊断组彼此不同,(2)个体在每个预先定义的组内是同质的。然而,在实践中,由于疾病的重叠或相似症状,患者可能被误诊,导致被分到同一组的被试可能出现生物学上不一致的变化。因此,诊断标记中可能存在的偏差将导致不准确的bio-marker,从而影响基于所提供的标签构建的分类器的识别能力。

所以当下,我们非常需要根据生物数据,并以客观和定量验证的方法确立领域标准,即RDoC initiative (www.nimh.nih.gov/rdoc) 。由于当前疾病分类学(特别是对于精神疾病)仍旧存在很多问题,因此从大量可能相关联的手段利用功能数据(例如,高维神经影像数据)识别生物标记,然后重建或优化基于neuro imaging-features的疾病分类学是一个巨大的挑战。一种前进的方法是考虑将标记识别和疾病析因分析(或将个体分类)作为一个综合问题。最重要和最困难的问题是如何提出一个数学上的,精确的解决方案,来确定什么是足够相似的病人,什么不是。        

5.2 从高维测量中识别准确的病理特征作为生物标志物是很困难的

考虑神经影响数据通常有比样本数量更多的特性,因此,减少特征或者说使用特征工程选取更好的特征作为模型判别的依据可能是更好的。正如在在前文中特征选择策略中所讨论的,大多数相关工作都是在组标记的背景下提取特征(SZHC)。即使使用监督的方法进行特性选择,结果特性也不一定能够按照预期在每个组中显示出组群属性,因为通常会考虑大量不相关和冗余的度量。在诊断不准确的情况下,选择特征以使它们能够在同一组内显示组群(或类似)模式以及在不同组之间显示不同模式更加困难。Clementz等人(2016)在未使用群体标记的情况下,根据已知的与精神疾病和大脑功能的相关性选择了一组认知和电生理特征,构建了生物模型。有趣的是,生物模型在精神疾病中比诊断分类表现出更合理的神经生物学异质性和亚群一致性(Clementzet al., 2015; Meda et al., 2016)

但是,该文章所选择的特征依赖于主观经验知识,并不是自动从现有数据中提取出来的。相比之下,一些研究工作(Gates et al.2014;Geisler et al.2015;Sun et al., 2015)使用了所有可用的特性,并且没有根据先前的知识进一步细化特性。对于新测试集,这种选择的特性可能无法展现出相同的分组一致性。在没有或较少诊断标记指导的情况下,能够自动选择具有良好鉴别能力的特征的更先进的方法仍在研究中。半监督的特征选择方法(Sheikhpour et al.2017)允许使用标记的和未标记的样本来发现特征的相关性,这可能是一个有效的探索路径。      

 5.3 确认生物标记物以及分类任务面临的困难       

一旦获得生物标志物和生物衍生的分类模型,验证生物标志物和分类(或分类)模型是另一个重要的问题。大多数相关研究都是基于已识别的生物标志物和训练有素的模型对独立被试数据集进行分类,然后将分类结果与诊断标签进行比较。然而,研究人员应该意识到,作为基础事实的诊断标签可能是不准确的。一些工作(Geisler et al. 2015;Clementz等人,2016)使用外部独立度量或与相同数据集使用的特征高度相关的其他特征来评估派生类别,以查看一组被试在这些额外度量方面是否表现出更大的相似性。然而,这种验证在某种程度上是循环的。一种更合理的技术是通过添加额外的独立被试数据或重新采样原始数据来评估生物标志物和聚类(或分类)的可重复性,因为一个合理的大脑疾病分类的模型应该能够使用不同的数据集映射到病理生理学。         

5.4 其他一些问题

在未来的临床应用中,还有其他值得考虑的问题。在大多数基于神经成像的研究中,主要集中在分类/预测问题上,准确性、敏感性和特异性被用来评估识别的生物标志物和建立的模型的识别能力。与筛选试验来检测潜在的疾病或没有疾病的人或者没有任何症状但携带疾病人的相比,这些评估指标(精度、灵敏度和特异性)不能提供一个现实的阳性结果(多大情况下会检测错误)或阴性结果(多大概率这个人有疾病)的预测值,因为不同疾病的流行程度会影响阳性/阴性结果。

除了对大脑疾病的分类进行准确的分类外,越来越多的研究关注于使用功能磁共振成像数据预测连续变量,如个体认知得分、症状得分和行为表现。这些研究使用不同的大脑功能连接特征作为输入,并为新的数据集生成这些特征的预测因子。线性回归和偏最小二乘法是实现这一目标最常用的方法。偏最小二乘法(PLS)特别有用,因为特征的数量通常比观察值/被试的数量要大得多。偏最小二乘法将预测变量投射到与响应变量相关的新特征空间中。

支持向量回归(Dosenbach et al.2010)则可以同时考虑所有的特征,并产生一个模型,分配不同的权重给不同的特征,也在此类研究中被大量使用。一般采用预测变量与测试集中实际记录变量的相关性来评价模型的性能。

应该注意的是,脑疾病也可以引起脑的结构变化,例如由于萎缩。在预处理步骤中,被试之间的fMRI数据空间对齐通常是通过将他们的平均结构MRI图像(一般是DARTEL方法进行综合调制)配准到解剖模板或直接将fMRI数据配准到回声平面成像(EPI)模板来实现的。然而,这些配准方法并不能保证完全准确的主体间功能一致性,尽管fMRI数据的后续空间平滑可以在一定程度上降低主体间功能的可变性。

因此,虽然基于自适应ICA的方法可能比基于ROI或体素的方法更可靠,但计算出的大脑特定区域之间的功能连接可能无法准确地跨被试来对应。未来,通过先进的归一化方法来基于功能磁共振成像数据的直接功能信息进行分类研究可以帮助解决这个问题(Khullar et al.2011;Jiang et al.2013;Cetin等人2015) 

总结:

利用fMRI数据绘制大脑功能连接是目前正在进行的研究的一个主要重点,这种研究的目的通常是识别有价值的生物标记和分类不同的大脑疾病。在这篇文章中,作者全面回顾了不同的方法来努力准确地绘制功能连接在该类研究中的应用概况和基本问题。

本文包括了传统的静态功能连接分析和最近应用的动态功能连接分析作为模型特征进行分类和预测大脑疾病的大部分文章,这些研究表明每一种方法都能够在一定程度上发现用于分类和预测的生物学标志物,但从实际的分类准确率和验证路径看,距离临床应用还有较大距离。此外,本文还对各种特征选择和分类器构建策略进行了综述,以进一步提供如何在实践中执行分类和预测问题的意见。最后对SZ-BPASD-ADHDMCI-AD进行了针对性的比较综述,进一步指出了在此类研究中存在的难点和重点。
原文:Classification and Prediction of Brain Disorders Using Functional Connectivity: Promising but Challengingdoi: 10.3389/fnins.2018.00525




微信扫码或者长按选择识别关注思影

如对思影课程感兴趣也可微信号siyingyxf或18983979082咨询。觉得有帮助,给个转发,或许身边的朋友正需要。请直接点击下文文字即可浏览思影科技其他课程及数据处理服务,欢迎报名与咨询,目前全部课程均开放报名,报名后我们会第一时间联系,并保留名额。


更新通知:第二十八届磁共振脑影像基础班(重庆,已确定)



更新通知:第十届脑影像机器学习班(已确定)


更新通知:第十二届磁共振弥散张量成像数据处理班(已确定)



第六届任务态fMRI专题班(预报名,南京)






眼动数据处理班(预报名)

数据处理业务介绍:



招聘及产品: