JAMA Psychiatry:使用机器学习的方法探究焦虑和创伤性障碍的跨疾病诊断症状簇以及其和脑,行为和日常功能状态的关联

    目前定义在焦虑,创伤性障碍的疾病间的症状存在着高度的重叠,尚且不清楚这些疾病的亚型在表现在功能(内在和脑功能)和临床(日常功能)上有多少的跨疾病性。识别疾病间亚型将有助于弄清当前诊断中的症状重叠,并可以作为调整治疗选择的工具。

    目标:提出并证明一种转疾病诊断样本中亚型的方法

    方法与被试选取:这项横断研究分析了来自脑研究和神经科学综合网络基础数据库2006年到2010年在悉尼大学和阿德莱德大学收集的数据,并在2013年至2017年在斯坦福大学复制的数据。研究中包含了420名被试数据,他们分别诊断为100名重度抑郁,53名恐慌症,47名创作后应激综合症,再加上220名正常被试

    主要成果:研究采用了一种数据驱动的方法来实现跨疾病诊断亚型的识别。分为以下几步:       

    1,使用分层聚类算法的机器学习以根据自我报告的负面情绪,焦虑和压力症状对被试进行分类       

    2,在独立的样本中测试了亚型的鲁棒性和普适性       

    3,评估行为和生理水平上是否表达为亚型症状       

    4,评估亚型日常功能在临床意义上的差异,使用临床诊断对结果进行解释。结果:最终分析的420名平均年龄为39.8岁,包含256个女性的被试中,识别出了6个疾病亚型:高焦虑型是55个(13%),一般焦虑38个(9%),快感缺乏29个(7%),忧郁症37个(9%)和正常状态的180个(43%)。亚型的差异分别表现在认知控制、工作记忆以及静息态脑电的β的能量值和情绪范式中的β能量值还有社会功能的能力和情绪可控      

    结论:本研究提供了一个数据驱动的架构,用来识别亚型及其与症状、行为,脑功能和可观察的功能性的关系,这些精神疾病的往常诊断都是依赖《精神障碍诊断和统计手册》(DSM)的诊断体系(黄金标准)。医生只需要根据手册上的诊断标准,核对患者的临床症状,即可做出诊断。DSM对不同病症的判定是异质性的,导致有至少50%的患者被同时诊断出几种类别的焦虑和混乱性的疾病。每种疾病的异质性不仅表现在症状水平上,而且还表现在潜在的行为和生理上。因此异质性问题极大的限制了医生掌握疾病发病机制、识别疾病发展有效生物标记以及干预疾病的机会。鉴于抑郁症和焦虑症已成为全球性致残和生产力下降的主要原因,而且只有三分之一的人从治疗中康复,因此鉴定此类生物标志物是一项紧迫的任务。在这个研究中作者提出一种补充性的数据驱动的方法用来揭示与行为生理和日常功能水平相关的症状簇。本研究发表在JAMA Psychiatry杂志(可添加微信号siyingyxf18983979082获取原文及补充材料)。


创新点:

   数据驱动的方法法早已运用于分类精神疾病。但以往的研究通常是将重点放在基于单个疾病类别(例如,精神分裂症,精神病,抑郁症,注意力缺陷/多动症和自闭症)中症状类型或严重性和行为的分类。单类别的聚类对于发现以数据为依据的单个类别内的亚型很重要,但不能表征跨多个疾病类别的异质性和症状重叠情况。在针对多种诊断的可用数据驱动的症状研究中,重点一直放在青少年的跨诊断样本上。目前,尚未有研究记录跨越了多种情绪,焦虑和创伤障碍以及综合症状成年人的症状群,并对多个功能级别的数据进行聚类(Clustering       

    (* 聚类就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作簇。处于相同簇中的数据实例彼此相同,处于不同簇中的实例彼此不同。聚类属于无监督学习,其中聚类的方法有很多种常见的有K-means、层次聚类(Hierarchical clustering)、谱聚类(Spectral Clustering等,而本文中使用的聚类方法是层次聚类

    本次研究目的:     

    1.应用无监督机器学习(unsupervised machine learning) 来识别代表性样本中的跨诊断亚组。*无监督学习技术是指事先不知道正确结果,或者无预期的情况下,发现数据本身蕴含的结构信息。)     

    2.验证独立样本中评估所得亚组的稳健性/鲁棒性(Robustness)泛化性(Generalizability )*机器学习中鲁棒性是指模型有较高的精度或有效性,有抵御或克服不利条件的能力。泛化性是指学习到的模型对未知数据的预测能力。)     

    3.整合多种数据来源,评估亚组在神经认知能力和大脑激活的独立(脑生理学)和外部指标(自我报告)方面的差异。     

    4.评估日常功能作为临床指标的意义。      

    作者将跨疾病诊断的数据与DSM-IV原始分类的数据进行比对,进一步提出假设疾病亚型会跨越目前DSM-IV原始疾病分类的界限。
方法

被试:       

    招募被诊断为重度抑郁症(MDD)、创伤后应激障碍(PTSD)和惊恐障碍的临床被试(根据DSM-IV标准)。共病情况见图1。排除终身性神经障碍、脑损伤、或其他影响认知、感觉和/或运动功能的障碍,或存在持续的物质使用障碍。最后只有420人被纳入研究,平均39.8(±14.1)(范围18-83)256(61.0%)为女性。另有381名成年被试样本,其中207名(54.3%)是女性,对聚类结果进行验证。

1重度抑郁症(MDD)、创伤后应激障碍(PTSD)和惊恐障碍被试的共病比例情况

(注:MDD:重度抑郁症;PTSD:创伤后应激障碍;Panic:恐慌症;GAD:广泛性焦虑障碍;ADHD:注意缺陷/多动障碍;Dys:情绪障碍;OCD:强迫症;SAD:社交焦虑障碍)  



自我报告症状:

   使用抑郁,焦虑和压力量表,版本21DASS-21)对负性情绪进行评估。

神经认知的行为测量:

   使用标准化的行为测试程序“ IntegNeuro”评估神经认知功能(图2),包括认知控制(选择反应时,注意转移,言语干扰/ Stroopgo/nogo和迷宫测试),工作记忆(数字广度和视觉记忆广度),语言流利度(以 FAS开头的生成的单词)和响应速度(手指敲击任务)。

2    神经认知的行为任务

大脑激活的神经生理学测量:

   分别在静息状态下和面部表情观察范式中记录EEG分别采集了两分钟睁眼和两分钟闭眼的静息态EEG数据。在有意识(无掩蔽)和无意识(掩蔽)条件下,被试观察表达恐惧,愤怒,悲伤和幸福的表情。根据1020个电极国际系统,使用Neuroscan Compumedics Nuamps系统和Quikcap电极系统(Compumedics Ltd)来记录EEG数据,该系统具有32个通道,包括4个眼电电极,一个orbicularis oculus 电极和一个肌电电极。根据先前有关负性情绪状态的脑电研究的结果,选择了α8-13 Hz)和β频段(14.5-30Hz)的数据进行分析。并将这些值在额叶区域(Fp1Fp2 F7F3FzF4F8),中央区域(FC3FCzFC4C3CzC4CP3CPzCP4),颞叶区域(T3T4T5T6),以及两侧的顶/枕区(P3PzP4O1OzO2)平均。将θ4-7.5 Hz)和δ1.5-3.5 Hz)频段指定为次要感兴趣的频带,并在探索性分析中证明了这些频带没有显著影响。替换掉每个电极位置离功率值均值3个标准差的离群值。通过减去α频段中FC3减去FC4的自然对数变换,量化负性情绪状态下额叶的不对称性。 

日常功能评估:

   日常功能状态通过简版的风险恢复指数进行筛查,共45个项目,包括社交技能和情绪弹性的评估。

数据分析:

1.无监督机器学习将个体分类为假定的亚型。

作者使用了R语言软件包(3.3.2版本)中的statspsychclusterfactoextra软件包以及Python3.6.2版本)中NumPySciPyIPythonJupytermatplotlibscikit-learn软件包进行统计分析。对所有被试(临床和对照组)的DASS-21(情绪自评量表)项目级数据进行了主成分分析。成分的数量由碎石图的描述和方差解释的百分比决定。再将所有被试(临床和对照)的症状成分评分输入到R群集软件包中的Ward平方误差和算法进行凝聚层次聚类 

*凝聚层次聚类是一种自底向上的的分层方法。每个数据对象都是一个簇,计算数据对象之间的距离,每次将距离最近的点合并到同一个簇。然后,计算簇与簇之间的距离,将距离最近的簇合并为一个大簇。不停地合并,直到合成了一个簇,或者达到某个终止条件为止。) 

2.在独立的验证样本中评估聚类解决方案的可重复性;
3.
为了进一步评估稳定性泛化性,在独立的验证样本中重复聚类方法。使用DASS-21的项目级数据进行了主成分分析,并将所得的成分分数用作使用Ward平方误差和算法创建的聚集层次聚类的输入,然后评估了所得聚类中心与原始聚类中心的接近程度假定的亚型在神经认知,神经生理和日常功能中的表达。       

    评估亚型在神经认知、神经生理和日常功能状态中分化的程度。用单因素方差分析检验6个亚型在神经认知、神经生理和日常功能状态中的差异,并进行事后比较。6个簇类解释方差与DSM-IV诊断解释的方差进行比较。用Bonferroni进行多重比较矫正。神经认知行为方面,对9个测试进行方差分析,经Bonferroni校正的α水平为P=0.006。神经生理学测试方面,分别对睁眼、闭眼以及意识和无意识情绪条件的脑电进行方差分析。在这些方差分析中,因变量是α和β波段的4个平均脑区功率值;因此,校正后的alpha水平为P=0.006。对α不对称性测量进行了方差分析,P=0.05。自我报告的日常功能方面,对社交技能和情绪弹性进行,其校正a水平为P =0.03
结果

   1. 无监督机器学习算法

    DASS-21(情绪自评量表)项目的主成分分析显3个成分的正交旋转在6次迭代中收敛(图3)。这些成分能够解释总方差的71.2%,将这3个成分命名为快感缺乏(anhedonia ),焦虑唤醒(anxious arousal)和紧张感(tension )。

3无监督的机器学习算法可识别6个簇

    每个簇或亚型都有独特的症状特征。根据每个亚型的症状平均得分,它们被解释为:情绪正常(Normative Mood)(n = 180);紧张(Tension)(n = 81);焦虑唤醒(Anxious arousal)n = 55);一般性焦虑(General Anxiety)n = 38);快感缺乏症(Anhedonia)n = 29);和忧郁症(Melancholia)n = 37)。单因素方差分析表明,亚型在快感缺乏、焦虑性唤起和紧张方面差异显著(1)。在年龄、性别或受教育年限方面没有显著差异。

1  亚型在快感缺失、焦虑唤醒和紧张三个维度的差异显著情况

2.独立样本的验证

   在独立的样本中,主成分分析确定了相同的3个成分,层次聚类计算确定了相同的6个亚型,表明该聚类方案可重复。
3.
神经认知行为测量中的表达

   亚型在其认知控制上有显著差异,通过go/no go测试测得(情绪正常者的z得分为0.038,紧张者的z得分为0.012,焦虑者的z得分为0.491,一般性焦虑z得分为0.903,快感缺乏症者为0.057,忧郁症患者为-0.163)。亚型在数字记忆力测验中的工作记忆方面也有所不同(情绪正常者z得分为0.062,紧张者z得分为-0.116,焦虑唤醒者z得分为-0.357,一般焦虑症患者为-0.209,快感缺乏症的人为-0.15,忧郁症患者为-0.260)。这种差异是由于对焦虑唤醒亚型的认知控制和工作记较差导致。可以证明认知实验中的表现与识别的亚型结果是吻合的。

Figure 1 10,000个重复的子样本中绘制出聚类中心,xyz轴上的标签指的是三个症状成分。 这些标签是基于假设PCA10,000个子样本中执行时产生的主成分与整个样本相同。 菱形表示原始集群解决方案的集群中心。 颜色对应不同族群。
4.在大脑激活的神经生理学测量中的表达

   亚型也在静息态大脑激活表现出差异,通过神经生理学测量的EEG功率评估。亚型在额叶区域的β能量不同(情绪正常者的z得分为0.160,紧张者的z得分为0.011,焦虑唤醒为0.047,一般焦虑症的者为0.013,躁狂症的者为0.725,忧郁症者为 -0.165),特别是在静息态睁眼的情况下。此差异主要与快感缺失亚型的β能量升高有关。亚型通过情绪诱发的EEG能量来进一步区分。在清醒状态的情绪范式中,幸福的面部表情诱发β能量差异较大,(情绪正常者z得分为-0.141,紧张者为0.052,焦虑唤醒者为-0.101,一般焦虑者为0.590,快感缺失者-0.127,忧郁症者为0.273)。升高的β能量主要归因于一般焦虑亚型的升高。亚型在EEG α频段不对称性的测量上没有显着差异。

5.日常功能表达

   亚型通过自我报告功能的差异在临床上表达,通过简明风险适应力指数筛查社交技能能力(情绪正常者z得分为0.287,紧张者z得分为0.280,焦虑唤醒z得分为-0.617,一般焦虑症者为0.195,快感缺失者为-0.529,忧郁症患者为-0.959)和情绪弹性(情绪正常者z得分为0.348,紧张者为0.188,焦虑者为-0.661,一般焦虑者为0.032,快感缺失者为-0.329,忧郁症的人-0.590)。情绪弹性低反映了忧郁症的功能的缺陷。 

6.与传统的诊断分类进行比较    

   作者将聚类所得的亚型映射到原始DSM-IV诊断类别上,提供了有根据的补充框架。结果显示亚型跨越了诊断界限,频率分布表明亚型由所有诊断组组成,说明亚型分类不能替代诊断例如,原始诊断为MDDPTSD的个体,分布在所有6个亚型中。

亚型中每种诊断的个体数量和百分比

总结

1. 机器学习分层算法根据特定的症状特征识别了6个体簇,将该6个簇复制到另一个独立的样本中,表明该聚类方案可以重复。

2. 与其他亚型相比(图4C),焦虑唤醒者在日常功能方面薄弱,并且神经认知损伤程度最严重,尤其是在认知控制方面。

3. 一般焦虑者(图4D)的特征是日常功能完整,但情绪诱发大脑顶枕区域β能量比情绪正常者以及焦虑唤醒者高。

4. 相比之下,忧郁症者(图4F)的日常功能最弱,尤其是与情绪正常、紧张、一般焦虑者比,社交功能受损严重。

5. 快感缺失者(4E)的特征是静息状态下前额β能量的升高。

6. 紧张者(图4B)尽管存在严重的紧张症状,但在每个领域表现较平均。

5  6个亚型在神经认知、脑电以及日常功能的表达



讨论

   虽然前人研究没有直接检测跨疾病诊断多个维度上的症状特征,但本研究中的特定特征与前人研究一致。本研究中焦虑唤醒亚型在神经认知方面的缺陷与前人研究中焦虑症认知受损一致。本研究中在忧郁症者观察到的社交,尤其是情绪方面的功能缺陷,以往被认为是忧郁症的标志。惊奇的是前额叶β能量的升高本与活跃或者焦虑的思想有关,而在本研究中却在快感缺失症者上发现。无独有偶,不止一项研究报告抑郁症与升高的β能量有关。一般焦虑者较差的工作记忆表现与升高的顶叶区的β能量可以部分解释核心工作记忆的缺损,然而在本研究中其他亚型在工作记忆上的表现的差异却不显著。相比之下,紧张亚组比较完整的状态或许反应了一种基本的补偿机制,或者反映了日常生活未受损的压力状态。

   未来研究应使用其他数据驱动技术以及样本进一步测试6个亚型结构的稳健性。本研究采用的是横断面设计(Cross-sectional designs,而采用纵向设计(Longitudinal designs))将有助于确定亚型是否随时间推移而稳定。为进一步阐明亚型的功能解剖基础,可采集高密度EEG(high-density EEG)数据进行源定位可以在潜在的脑回路中确定跨疾病诊断亚型。成像也应被视为与症状测量一起用于聚类和验证聚类方案的主要参数。几项基础研究已利用静息状态下功能性大脑连接的成像来识别抑郁症患者样本中的神经生理生物类型,这些新颖的方法对抑郁症的理解产生了深远影响。

    本文提出一种使用数据驱动法针对精神障碍的分类,将特定的症状映射到潜在的神经行为维度上。为临床诊断和干预治疗提供了一种新的思路。例如,根据一般的焦虑亚型特征,可以针对工作记忆进行干预,或者观察由情感诱发的EEG β 能量变化来确定干预效果。由于症状表征会映射到临床相关领域,因此它们为开发个性化治疗提供了新的依据。
如需原文及补充材料请加思影科技微信:siyingyxf 或者18983979082(杨晓飞)获取,如对思影课程及服务感兴趣也可加此微信号咨询。觉得对您的研究有帮助,请给个转发,以及右下角点击一下在看,是对思影科技莫大的支持。

微信扫码或者长按选择识别关注思影

非常感谢转发支持与推荐

如对思影课程感兴趣也可微信号siyingyxf或18983979082咨询。觉得有帮助,给个转发,或许身边的朋友正需要。请直接点击下文文字即可浏览思影科技其他课程及数据处理服务,欢迎报名与咨询,目前全部课程均开放报名,报名后我们会第一时间联系,并保留名额。




第九届脑电数据处理入门班(重庆,9.22-27

 

第二十一届脑电数据处理中级班(南京,9.7-12

第二十二届脑电数据处理中级班(南京,11.12-17

 

第七届脑电信号数据处理提高班(南京,11.18-23

第八届眼动数据处理班(重庆,10.26-30

 

第九届近红外脑功能数据处理班(上海,11.24-29

 

第三十二届磁共振脑影像基础班(南京,9.21-26

 

第六届小动物磁共振脑影像数据处理班(南京,9.1-6

 

第十一届脑影像机器学习班(南京,8.25-30

 

第十三届磁共振弥散张量成像数据处理班(南京,9.15-20

 

第六届任务态fMRI专题班(南京,10.16-21

 

第二届弥散磁共振成像数据处理提高班(南京,10.24-29

 

第七届磁共振ASL数据处理班(南京,10.12-15

 

第十八届磁共振脑网络数据处理班(南京,11.6-11

 

第三十四届磁共振脑影像基础班(南京,10.30-11.4

 

第三十一届磁共振脑影像基础班(重庆,9.14-19

 

第三十三届磁共振脑影像基础班(重庆,10.11-16

 

第十七届磁共振脑网络数据处理班(重庆,10.20-25

 

第十届磁共振脑影像结构班(重庆,11.2-7

 

第十二届脑影像机器学习班(重庆,11.11-16

 

脑磁图(MEG)数据处理学习班(预报名)


数据处理业务介绍:


思影科技拜访式培训服务


思影科技功能磁共振(fMRI)数据处理业务


思影科技弥散加权成像(DWI/dMRI)数据处理


思影科技脑结构磁共振成像数据处理业务(T1)


思影科技啮齿类动物(大小鼠)神经影像数据处理业务


思影数据处理业务三:ASL数据处理


思影科技脑影像机器学习数据处理业务介绍

 

思影科技EEG/ERP数据处理业务

思影科技脑电机器学习数据处理业务


思影数据处理服务五:近红外脑功能数据处理


思影数据处理服务六:脑磁图(MEG)数据处理


思影科技眼动数据处理服务


招聘及产品:

招聘:脑影像数据处理工程师
(重庆&南京)


BIOSEMI脑电系统介绍


目镜式功能磁共振刺激系统介绍