FreeSurfer自动分割海马亚区算法的重测信度分析

最近,来自波士顿荣军医疗保健系统和哈佛医学院等多个单位的研究人员,在Neuroimage杂志上发表了研究,对FreeSurfer计算海马亚区的两种方法(标准处理和纵向处理)跨站点重复测量的信度进行了评估,进一步验证该方法具有较高的信度。

 

摘要:   

人类海马容易受到一系列退行性疾病的影响,因此,通过神经成像对海马体和海马亚结构进行准确的测量对于了解疾病的机制以及在新型疗法的临床试验中用作生物标记物具有重大意义。尽管可以相对可靠地测量海马总体积,但了解这一信度如何受到不同扫描仪采集的影响至关重要,因为在大规模临床试验中可能会使用多个扫描平台。对于海马亚区测量尤其如此,最近的研究诸如FreeSurfer之类的通用图像处理平台进行测量。由于这些亚区的尺寸小,大脑内侧颞叶区域的磁共振成像(MRI)信号丢失以及缺乏与标准神经成像程序相对照的对比度,因此,这些区域的准确分割具有挑战性。

在这里,作者使用两台西门子扫描仪(TrioPrismafit Trio升级版)评估FreeSurfer自动分割海马亚区的重复测量的信度研究者对11名健康的年轻参与者进行了T1加权图像的采集(Trio进行了两次扫描,在Prismafit进行了一次扫描)。每次图像都是通过标准的处理流程和FreeSurfer v6.0中最近发布的纵向处理的流程进行进行海马区分割。对每个个体体积测量的重复信度进行了检测,评估参数包括体积差百分比,Dice重叠系数和组内相关系数值(ICC)分子层(molecular layer)、齿状回和全海马体积的信度较高,在三个时间点扫描中,扫描之间的平均体积差异小于3%,重叠大于80%ICC>0.95。海马旁下托和海马沟信度最低,平均体积差大于5%,重叠小于70%ICC评分在0.78-0.89之间。其他的亚区,包括CA区域,平均体积差和重叠(分别<5%>75%)是稳定的,并且在三次扫描后的信度有所提高(ICC>0.9)。在同一扫描仪内的信度一般较高(Trio-Trio),且在不同的扫描之间(Trio- Prismafit)的信度也较高,不存在明显的偏倚。这些结果表明,FreeSurfer自动分割算法是测量海马亚区体积和总体积的可靠方法,可能在未来的临床应用中是有所帮助的。 

介绍:

海马这一结构涉及到多种认知功能,包括记忆、奖赏处理和执行过程。在组织学水平上,这一边缘区域是极其复杂的,但主要的亚区有其明显的功能特性,且可以通过脑影像处理方法识别出在病理上易受损的区域。这些亚区有不同的定义,但通常包括:齿状回、下托、旁下托、内嗅皮层和四个角区(CA)既往的研究已经证明了海马及其亚区在整个生命周期内具有较高的可塑性,比如在关于情景记忆中,该区域将经历一个不断加强、弱化和改变的过程。该区域对一系列对神经元有负面影响的情况也很敏感,包括缺氧、应激激素和阿尔茨海默病(AD)。因此,海马体及亚区的改变已在多种神经精神疾病和退化性疾病中被报道,包括精神分裂症(SZD)、创伤后应激障碍(PTSD)和阿尔茨海默病。鉴于海马在认知和疾病方面都有重要的地位,评估这些亚区测量的信度是神经影像学的主要目标,其临床应用包括随访神经退行性疾病的进展过程,以及在大型多中心临床试验中作为监测治疗反应的生物标志物。

海马的测量在既往的工作中已经被证明是可靠的,然而,亚区结构由于体积小,在典型的结构磁共振成像(MRI)相中缺乏适当的信号比,因此在精确分割和测量方面存在不足。最近在获取硬件和序列技术的各个方面的发展提高了扫描质量,与从前相比,包括分辨率和信噪比(SNR)都克服了之前的一些限制。此外,最近新的技术也被开发来分割MRI图像中的海马亚区。作者在这里研究了FreeSurfer处理流程(6.0;http://surfernmr.mgh.harvard.edu)该方法最近被证明能够在AD患者和认知健康对照者之间提供稳定的鉴别(88%的准确率)这些结果突出了此类处理方法的敏感性和临床实用性,但没有提供关于重复测量的信度,以及纵向测量必要参数和临床试验中治疗效果的潜在评估。

在这里,作者获得了在西门子Trio扫描仪的两个时间点和西门子Prismafit (Trio升级)一个额外时间点的扫描,检查了重复测试的信度,进而确定在纵向研究中海马亚区测量的实用性。这项工作遵循之前的研究,对FreeSurfer的自动海马分割算法的信度进行了检验,并评估了以前没有研究过的跨扫描仪的测量结果。该研究的工作采用FreeSurfer 6.0中的标准处理流程,此外,还使用了FreeSurfer 6.0中最近发布的纵向分析工具。结果表明与标准处理流程相比,纵向处理流程提供了一个更可靠的测量结果,并支持其作为潜在的神经影像生物标志物的使用,进而跟踪疾病的进展和在临床试验中测试治疗反应的预后测量,比如在与海马有关的神经退化疾病中。 

方法:

2.1 被试   

 11名健康的年轻人和中年人参与了这项研究(年龄在22岁到55岁之间;平均值:30.2;SD: 9.43年。男性6人,女性5)。所有参与者在2个月内接受了基线扫描和后续扫描,扫描范围为7-50天,使用西门子Trio扫描仪。然后,在第二次Trio扫描后,在升级的西门子Prismafit扫描仪上进行第三次扫描,对参与者进行大约2个月的扫描(范围为50-70) 

2.2 图像采集     

每个受试者进行了3次扫描。西门子TrioPrismafit是两种广泛应用于神经影像学研究的扫描仪。两者之间的过渡是一个主要的硬件和软件升级,本质上,唯一不变的是主静态磁场。此外,序列不完全相同,这就增加了影响图像采集的变量。在每次扫描过程中,获取的图像包括2张高分辨率T1加权图像,这些图像使用磁化制备的快速梯度回波(MPRAGE)20通道的相控阵头线圈,参数为200Hz/像素带宽,翻转角=7°,Trio: TR/TE/TI=2.53 s/3.32 ms/1.1s, Prismafit:TR/TE/TI=2.53s/3.35ms/1.1 s). 所有的扫描3D矢状位扫描包含176 (矩阵=256×176,分辨率=1mm,层厚=1mm).两个序列的采集时间均为6:02分钟。 

2.3 图像分析

2.3.1 标准FreeSurfer处理流程   

所有T1加权图像均进行运动伪影和灰白色对比度检查。在每次扫描过程中使用较少运动伪影的单次采集图像,避免引入噪声信号。大脑皮层重建和体积分割是在FreeSurfer图像分析软件6.0版中完成。这个处理流程还包括:运动校正和对多个体积T1加权图像进行平均, 剥除非脑组织,通过使用混合分水岭/皮层表面变形的过程, 自动化Talairach变形, 分割皮层下白质和深部灰质结构(包括海马、杏仁核、扣带回、壳核和脑室),强度归一化,灰质白质边界的网格化,自动拓扑校正,表面变形,强度梯度最优位置灰/白质边界和灰质/脑脊液流体边界的位置转变最大的强度定义转换到其他组织类。FreeSurfer形态测量已被证明在不同扫描仪之间和不同场强之间具有良好的重复测量的信度。在所有受试者通过标准处理流程后,为了保证灰质/白质和灰质/软脑膜表面分界的准确性,对数据进行人工检查和编辑。 

2.3.2 纵向处理   

纵向研究面临的一个重大挑战是,由于受试者或仪器相关因素,重复MRI扫描的受试者数据具有可变性和较低的再现性。然而,通过使用纵向处理方法的特异性可限制该可变性,并且避免了与常见方法相关的混杂效应。为了提取可靠的体积和厚度值,在FreeSurfer v6.0中使用纵向自动处理图像流程。具体来说,先创建一个无偏差的被试模板空间和图像,并进行反向配准。若干处理步骤包括:颅骨剥离、Talairach变换、atlas及球面图配准和分割,然后用基于被试者内部的模板进行初始化,显著提高信度和统计能力。使用这种方法,一个被试内的模板被引用来实施不同时间点的一致性分割,从而减少与纵向分析相关的混杂效应,进而提高整体分析的鲁棒性和敏感性。作者的纵向处理包括三个时间点的扫描,包括同一扫描仪内重复的两个时间点(Trio-ATrio-B)和跨扫描仪(Trio-BPrismafit)第三个时间点。 

2.3.3 海马亚区   

FreeSurfer v6.0一部分发布的标准处理流程的内容用于海马亚区自动分割并重建的处理流程,从而产生了每个亚区的体积估计值。FreeSurfer v6.0还发布了一种用于纵向处理的海马亚区分割的算法。该算法对每个被试生成被试内模板,其中处理步骤是使用被试内模板中的共同信息对每个时间点图像进行初始化处理。简单地说,单个亚区的分割算法是基于图像强度的贝叶斯推理,以及人工分割和超高分辨率(~0.1 mm各向同性)标记MRI数据库建立的概率图谱。纵向处理流程使用海马的二值模板,该模板是使用从每个受试者的基础模板分割中提取出来的。   

海马亚区分割可视化见图1,三维渲染图见图2

1 单个被试的海马亚区分割和彩色示意图



2  单个被试的海马亚区3D渲染图

2.4 统计方法

2.4.1 体积差百分比和Dice重叠系数

    通过计算平均体积差百分比和Dice重叠系数来确定由公式(1)和公式(2)给出的每个子区域的体积对应关系。

    

注:三次扫描分别表示为A-B;B-C;A-C

在公式中,A表示Trio扫描仪第一次扫描时的给定亚区的测量值,B表示Trio扫描仪第二次扫描时的相同亚区的测量值,C表示Prismafit扫描仪提供的亚区测量值。

公式(1)用于估计两台扫描仪(Trio-ATrio-B;Trio-BPrismafit-C;Trio-APrismafit-C),其中最优值为0表示体积没有差异,增大的值表示体积差异更大。

公式(2)用于估计两次扫描之间的Dice重叠系数,在相同体积下得到100的最优值,值的减少表示重叠减少。Dice重叠系数是一种常用的度量方法,用于验证真实值和估计值之间的对应关系。

所有的亚区体积都在某种程度上与海马总体积相关,作者通过皮尔逊相关和p值来检验左、右海马亚区体积与同侧海马体积的相关性。

 

2.4.2 组内相关系数(ICC)   

使用体积差百分比和Dice重叠系数来进行单独检查其信度是不够的,因为体积差异并不能一起评估被试内和被试间的变异性,Dice重叠系数也不能说明真实标签的变异性,而真实标签对于确定一个方法是否可以被认为“足够好”至关重要。在重复测量数据中,组内系数(ICC)可用于测量受试者内相对于受试者间的易变性。第三种形式的ICC (ICC3,1),在以前的文献中定义为,应用于每个亚区,用以估计在两台扫描仪上的三次扫描之间的测量一致性。重复此计算以估计同一扫描仪提供的两次扫描的一致性。为了评估海马亚区横向分析和纵向分析的信度,作者分别报告了两种处理方法的结果。 

3.结果:

3.1 体积对应的结果   

 3为标准FreeSurfer处理流程和纵向处理后的容积差百分比。值表示每次比较的结果(Trio-ATrio-BTrio-BPrismafit-CTrio-A Prismafit-C)海马总体积、分子层、齿状回、CA1在所有时间点上的一致性最高。纵向处理的结果表示,各时间点间的平均体积差小于3%海马裂、旁下托和海马伞的一致性最低,各时间点间的平均体积差异大于5%Trio-ATrio- B的体积差始终低于跨扫描仪的体积差值,这表明同一扫描仪内的结果总体上表现更好。

3 纵向处理的结果提高了所有区域重复测量的信度。

 

    4显示了FreeSurfer的标准和纵向处理流程在同一扫描仪内和跨扫描仪两个时间点的平均体积差百分比。海马总体积、分子层和齿状回稳定性最好。然而,扫描仪内部的体积差异始终低于跨扫描仪之间的差异,这表明在同一扫描仪测量中的结果表现得更好。左右海马亚区在时间点和处理上的体积百分比差异无统计学意义(p>0.05)。这表明额外机器的扫描可能会增加噪音信号,因此纵向估计的结果可能受到影响。

4 纵向处理的结果提高了所有区域重复测量的信度。

 

    5显示了经过标准和纵向处理的Dice重叠系数系数。值表示每次比较之间的Dice重叠系数值。海马总体积、下托、旁下托和海马尾的跨时间点的一致性最强,各个时间点的重叠系数值超过75%。只有海马裂是最不一致的,在不同时间点之间的平均体积重叠小于70%。在纵向处理结果中,Dice重叠系数系数是升高的,多数亚区的得分大于80%

5 纵向处理的结果提高了所有区域重复测量的信度。

 

    6显示了经过FreeSurfer标准和纵向处理的两个时间点(包括同一扫描仪内和跨扫描仪)Dice重叠系数系数。海马总体积、CA4和海马尾在两个时间内是保持稳定的。在纵向处理的结果中,各个亚区的重叠系数值不断增加,大多数的亚区得分达到75%或更高。不同时间点和左右海马亚区的Dice重叠系数系数值无统计学意义(p>0.05)。然而,在同一扫描器内的Dice重叠系数系数值始终高于跨扫描器之间的值。这进一步表明,用额外的机器扫描可能会增加噪声信号并影响纵向处理流程的结果。

 SHAPE  \* MERGEFORMAT

 

    7显示了使用两种处理方法中在扫描仪内和跨扫描仪两个时间点的海马总体积图。海马总体积通过半球配对来观察原始值的信度。在纵坐标处理图中,相关系数越高,表明该处理方法的稳定性越好。

7 纵向处理的结果大大降低不同扫描仪间海马总体积的噪声。 

SiemensTrio扫描仪与SiemensPrismafit扫描仪在标准横向处理和纵向处理后,每个被试配对的不同半球海马总体积之间的相关图。左半球为红色,右半球为绿色。

 

    1报告了各个时间点上,各亚区体积与同侧海马总体积的相关系数。左、右亚区体积与海马总体积呈正相关。双侧海马下托、CA1和分子层与各自半球的海马总体积的相关性最强(r > 0.90, p < 0.001),而相关系数最低的是左、右海马裂和右旁下托(r < 0.50, p < 0.001)

1 标准处理和纵向处理的不同扫描仪间三个时间点(从Trio-ATrio-BPrismafit)的海马亚区体积与海马总体积的相关系数。所有亚区体积均显示与同侧海马体积之间存在显着相关性(p <0.001)。

3.2 重复测量的信度   

不同亚区的结果均表现出较高的信度,标准处理流程显示其信度为0.74-0.98,纵向处理流程为0.92-0.99(所有三个时间点,表2)。体积百分比的结果显示不同亚区同时保持高信度的能力,包括分子层,齿状回、海马总体积(> 0.98),以及中等稳定性的亚区,包括海马裂,海马旁下托,海马伞和CA3(> 0.92)三个时间点均纳入后,纵向处理所得的各区域ICC值均大于0.90纵向处理的ICC值明显高于与标准处理的值,包括右侧CA1、海马裂、右侧齿状回、右侧CA3、右侧CA4、海马伞、右侧HATA和海马总体积。作者观察到在标准处理中左海马亚区区域的信度高于右海马亚区,其差异有统计学意义(p < 0.05)。然而,在纵向处理过程中,不同半球之间的信度没有显著差异(p > 0.05)
2在不同扫描仪之间(Trio-A, Trio-BPrismafit)及不同的处理流程,各个亚区的组内相关系数值

        

扫描时仅包含两个时间点(3),亚区体积呈现出相对稳定,ICC得分大多在0.90以上,右侧海马裂和右侧CA3得分在0.80以下。虽然这些区域的结果都不太一致,但在纵向处理中其稳定性显著增加。在两个时间点通过标准处理或纵向处理的结果显示,半球的信度系数无统计学差异(p > 0.05) 

3 2个时间点内(Trio-BPrismafit)及不同的处理流程,各个亚区的组内相关系数值

结论:   

本研究介绍的结果反映了根据T1加权扫描估计的自动海马领域测量值的重测可靠性。使用类内相关系数(ICC),体积差异百分比和Dice重叠系数,研究者能够量化freesurfer分割的可靠性。并且研究结果表明,大多数区域是高度稳定的,被试和试次间的差异很小。但是,研究者发现包含额外的扫描仪会影响可靠性。在纵向处理中,跨站点(TrioPrismafit)扫描相比的同站点多次(Trio-ATrio-B)扫描的可靠性较差。这些结果可能表明需要对纵向研究中的各个受试者的纵向点进行匹配。     

该研究从技术层面分析了同一扫描仪及不同扫描仪的3个时间点3D-T1扫描,且用FreeSurfer发布的标准处理流程和纵向处理流程的结果进行差异信度的分析,其结果表示,如果有多个时间点的结构像,用纵向处理流程的方法得到的稳定性较高,也就意味这样的处理方法是比较可靠的。
原文:Test-retest reliability of FreeSurfer automated hippocampal subfield segmentation within and across scanners


微信扫码或者长按选择识别关注思影

如对思影课程感兴趣也可微信号siyingyxf或18983979082咨询。觉得有帮助,给个转发,或许身边的朋友正需要。请直接点击下文文字即可浏览思影科技其他课程及数据处理服务,欢迎报名与咨询,目前全部课程均开放报名,报名后我们会第一时间联系,并保留名额。


更新通知:第二十八届磁共振脑影像基础班(重庆,已确定)



更新通知:第十届脑影像机器学习班(已确定)


更新通知:第十二届磁共振弥散张量成像数据处理班(已确定)



第六届任务态fMRI专题班(预报名,南京)






眼动数据处理班(预报名)

数据处理业务介绍:



招聘及产品: