跨性别者(TIs)表现出不同于其生理性别和心理性别的大脑结构变化。本文结合多变量和单变量的分析方法,证实TIs的大脑结构不同于男性和女性。对1753名顺性别者(CG,就是从心理上认同自己的生理性别)健康被试,基于体素的形态测量预处理后得到灰质分割结果,用于训练(N=1402)和验证(20%,N=351)可以对生理性别进行分类的支持向量机分类器。作为第二次验证,对1104名抑郁症患者进行分类。第三次验证使用与CG样本匹配的跨性别者女性(生理性别男、心理性别女,TW)样本。最后,通过控制性取向、年龄和大脑总体积的单变量分析,比较了CG男性、女性和TW跨性别激素治疗(CHT)前后的大脑体积。将生理性别分类器应用于跨性别者样本,真阳性率显著降低(TPR-男性=56.0%)。有抑郁者(TPR(真实标签正确预测)-男性=86.9%)与无抑郁者(TPR-男性=88.5%)的TPR差异无统计学意义(P>0.05)。对跨性别者样本的单变量分析表明,TW治疗前后在壳核和脑岛,CG女性和CG男性的脑结构存在差异,与全脑分析的结果一致。作者的结果支持这样的假设,即TW(跨性别者女性)的脑结构不同于其生物学性别(男性)的脑结构,也不同于他们感知的性别(女性)的脑结构。这一发现证实了TIs大脑结构发生变化,导致了与CG个体的不同。
1.前言
跨性别者描述的是具有属于异性的稳定感觉,而不是出生时指定的生理性别,而术语顺性别(CG)描述的是生理性别和心理性别之间的一致性。虽然关于用来描述性别的术语和短语在社会和政治学中存在争议,但人们对生理性别和心理性别之间的差异是如何出现的知之甚少。一种流行的观点认为,跨性别者(TIs)的大脑分化和身体发育存在偏离。这方面的证据来自对患有先天性肾上腺增生的女婴的研究,这些女婴会发展出男性的游戏行为。由于产前循环中的睾酮,这些女婴的大脑在结构上被组织成男性的大脑,而他们的身体发育是女性的。
先前研究提供了大量的信息,说明大脑结构是如何随着生理性别的不同而不同。简而言之,局部性性别差异显示,CG男性的灰质体积大,而CG女性的边缘结构体积特别大。然而,与外表相比,大脑中的性别分化似乎没有那么明显。因此,大脑不能轻易地分成两种性别。
很少有基于ROI的方法来研究TIs的大脑结构与CG个体的不同之处。与CG男性相比,跨性别者女性(生理性别男、心理性别女,TW)表现出与身体知觉相关区域的结构性改变,如壳核和脑岛。然而,这些改变在方向上是高度异质性的,报道的研究只调查了跨性别激素治疗(CHT)之前的个体。TW-CHT前/后与CG个体的比较也显示出不同的结果。TW的CHT结合了抗雄激素和雌二醇的治疗,并与大脑的局部结构改变(如局部体积和皮质厚度减少)有关。然而纵向研究是稀有的,最近的一项大型研究没有发现TW在CHT治疗前后的任何差异。
多变量分析为CG和TIs之间的异同提供了新的见解。与单变量分析不同,多变量分析不侧重于识别个体之间的平均差异,而是识别适用于个体水平数据中的区别性模式。这可以将数据细分为更广泛的类别,也可以用来识别不寻常的模式和不易分类的情况。这种方法对TIs来说特别有趣,因为他们感觉到了他们的性别和生理性别之间的差异。因此,可以假设它们代表了表现出不寻常的数据模式的情况,例如,激素水平、人格特征或大脑功能和结构。最近的研究还显示了TIs和CG个体之间的各种脑结构差异。因此,单变量方法可能不适合阐明TIs和CGI个体在结构上的不同之处。
选择多变量分析的另一个原因是TIs的样本通常很小。使用多变量方法对CG个体的大样本进行训练和验证,并将其应用于TIs,可以得到关于TIs和CG个体之间的脑结构差异的更有效的结论。
多变量分析已经被用来研究是否可以通过脑体积将TIs从CG个体中分离出来。研究都表明,与CG人相比,TIs生理性别分类的准确性降低。然而,最近有人批评说,用小样本量训练的分类器往往会导致高精度,但外部效度较低。因此,与以前的研究不同,作者训练并验证了一种生理性别分类器,该分类器使用了大量的CG被试样本,没有任何精神并发症。然后,作者将其应用于较小的TW样本。为了确保观察到的错误分类不是因精神疾病引起或产生偏差,作者在另一个大样本中对分类器进行第二次验证-严重抑郁症(MDD)患者。在与CG匹配的TW样本中进行第三次验证,他们的数据是在同一个时间段及扫描机器中采集。
对多变量分析的假设是:
(1)在健康CG被试上训练的分类器应用于TW样本时有明显较差的性能;
(2)在健康CG被试上训练的分类器应用于患有严重抑郁症的CG患者样本时表现得同样好。
按照多变量方法,本文考察了壳核和脑岛的局部结构变化。由于TW在脑结构上与CG男性和女性都不同,作者假设:
(3)相比CG男性,CG女性的脑体积较小
(4)相比CG女性,TW-CHT治疗前后体积更大
(5)相比CG男性,TW-CHT治疗前后体积更小由于预计CHT与大脑结构进一步女性化相关,因此体积减少,作者假设:
(6)与TW-CHT后相比,TW-CHT治疗前的脑体积更大
2.方法
为了获得和验证基于结构MRI的生理性别预测因子,使用了三个不同的样本,目的为:使用交叉验证程序对大样本CG没有任何精神障碍的个人进行分类器训练。预先随机抽取的独立子样本,作为第一个验证集,以避免过拟合。为了排除抑郁症状影响TW组预测指标的性能,使用了MDD患者作为第二个验证集。接下来,将分类器应用于来自TW个体以及第三验证集,第三验证组的数据是与TW样本同时且使用相同的扫描仪获取的。
数据
顺性别训练样本和第一个验证集。来自1753名没有任何精神障碍的CG被试的数据作为训练集。使用遵循DSM-IV标准的结构化临床访谈排除精神病史。被试来自三个不同的队列:Muenster神经成像队列(MNC,N=666)、BiDirect研究(BD,N=434)和FOR2107研究(N=653)。MNC的排除标准是存在或有重大神经疾病史,依赖或最近滥用酒精或药物,高血压,以及一般MRI禁忌症。BD和FOR2107具有相似的排除标准,详见补充S1。
第二验证集:严重抑郁症(MDD)患者。为排除TW并存抑郁症在分类上的潜在差异,以诊断为MDD的临床样本(N=1404)的作为第二验证集。450名MDD患者表现出焦虑症或药物滥用。根据DSM-IV标准再次用结构性临床访谈验证诊断。MDD样本包括来自MNC的285名被试,来自BD的591名被试,以及来自FOR2107的528名被试(补充S1)。其他排除标准包括双相情感障碍、分裂情感障碍和精神分裂症、物质相关障碍、目前有目苯二氮类药物治疗(参与研究前至少经历三个半衰期)和最近经历过电休克治疗。几乎所有的患者都接受了精神药理学的抗抑郁治疗和/或接受了心理治疗。
跨性别者样本和第三验证集。为了测试CG和TW的不同分类,使用了29名TW独立样本。由于糟糕的图像质量和伪影,三个TW剔除。TW的数据与一组CG对照一起收集,包括19名CG女性和15名CG男性(跨性别者研究(TSS))。TW是在明斯特大学精神病学系门诊治疗期间招募的。在治疗和纳入研究之前,所有被试都接受了仔细的染色体异常测试,如Klinefelter综合征,并根据DSM-IV标准使用结构性临床访谈I和II筛查人格障碍和其他精神疾病并存症(并存症在补充S5中列出)。TW和CG的数据在相同的条件下采集(例如,扫描仪、时间范围、研究方案、调查员),排除了由于扫描仪的波动可能造成的偏差。TW处于不同的治疗状态,其中18人已经接受了激素治疗。
图像采集和结构预处理。图像采集和结构预处理遵循之前公布的针对MNC、FOR2107和BiDirect Cohort的方法。预处理基于CAT12工具包。对于单变量分析,图像额外使用8mm高斯核进行了平滑,使用0.1的绝对阈值做mask。并仔细检查了图像质量。
分析
多变量分析。生理性别的个体化预测使用支持向量分类器进行评估,该分类器在Scikit-Learning工具箱中实现。使用CAT12全脑灰质图像作为分类器输入。灰质图像被重新分割到3×3×3 mm³体素大小,以在保持最大局部形态测量学差异的同时降低维数。通过选择20%的随机验证集(N=351,女性=219,男性=132),将训练过程与评估严格分开,该验证集在分类器训练和测试期间没有使用。用随机采样对剩余的1402名被试进行10折交叉验证 (N=1218,女性=609,男性=609),每组为1096名性别平衡的数据集。接下来进行主成分分析,以进一步降低数据的维数。主成分的最大数量被限制在1096个。作者对支持向量分类器进行了基于贝叶斯统计的超参数优化(SCHKIT-OPTIMIZE),嵌套在十折交叉验证中。参数搜索包括核函数的选择(径向基函数或线性)、影响误分类惩罚的C参数(10−2-102,非离散对数标度)和影响决策边界曲率的Gamma参数(10−6-10,非离散对数标度)。在这种迭代贝叶斯方法中,总共评估了100个参数组合,报告了ROC曲线下面积(AUC)。最终使用第一个验证集(预先从原始样本提取的20%)确定由最佳超参数组合产生的分类器。为了排除精神疾病并存抑郁的潜在影响,对MDD被试样本重复这一步骤,作为第二验证集(图1)。
然后将最终训练和验证的分类器应用于具有TIs的第三验证集中。为了测试CG男性和TW(相同生理性别)之间的分类结果是否不同,作者采用了真阳性率(TPR),因为平衡正确率(BACC)不适用于仅一组的情况。费希尔(Fisher)精确检验用于阐明样本间TPR是否有统计学差异。TPR的假设是TW属于男性生理性别范畴。
图1 训练好的分类器在生理性别预测中的应用
为了实现分类器的最优泛化,本文特意将多台扫描仪合并在一起。不打算对扫描仪可能存在的影响进行校正。相反,目的是在训练数据量大且期望分类性能良好的情况下,建立基于扫描器不变特征的分类器。不同扫描仪之间识别率的比较没有显著差异。因此,无法检测到扫描仪对分类结果的影响-支持本文的预期(补充表6)。然而,需要指出的是,数据显示,在多扫描仪训练集上训练的分类器的分类性能(第一次验证中的BACC为94.01%)与其在单扫描仪环境下(94.03%的BACC)第三个验证样本(TW样本的CG对照组)上的效果基本相同,这表明该分类器学习了扫描仪的独立特征驱动分类性能。
单变量分析。对第三验证集中的TW和CG被试进行单变量分析,使用SPM进行统计学分析。壳核和脑岛利用WFU_Pickatlas中的AAL模板确定,利用ANOVA统计了组别和灰质体积的关系,并将年龄、颅内总体积、性取向作为噪音回归量。性取向为0-100的连续值(0是同性恋,50是双性恋,100是异性恋),根据生理性别定义。并进一步进行全脑分析,探究可能存在体积差异的脑区。进行p<0.05的FEW校正。并应用TFCE工具箱执行5000次置换检验,确定两个双侧ROI(脑岛、壳核)和全脑分析中的统计显著性。
3.结果
多变量分析
顺性别数据集训练和验证。分类器的训练产生了两个结果。第一个结果是用贝叶斯最优化方法确定的超参数集的估计。超参数优化估计支持向量机的最优近似为径向基函数核,C=27.3,γ=2.4×10−0.5。基于估计的超参数,第二个结果是20%验证集的分类结果,这为训练的分类器提供了性能指标。验证集分类的BACC为94.01%(表1)。混淆矩阵(补充表3)显示,分类器对女性生理性别(TPR=99.9%)的分类比男性生理性别(TPR=88.5%)更准确。这些结果通过ROC曲线可视化,该曲线基于分类为男性的概率,曲线下面积(AUC)为0.99。
MDD第二验证集。为了排除MDD并存症对分类器的影响,使用由1404名MDD被试(853名CG女性,551名CG男性)组成的第二个验证集。分类器BACC达到了92.06%,CG男性的TPR为86.93%(表2,补充表2)。分类器结果相应的ROC曲线见补充图2d,AUC为0.99与第一验证集的结果相似。费希尔精确验证显示两次验证的结果分布没有显著差异(补充表6)。
第三验证集。BACC为94.03%(CG为TW样本的一部分)。CG男性TPR为93.3%,CG女性TPR为94.7%(表3)。然而,TW的TPR是非常低为56%(补充表4),ROC曲线可视化见补充图2bc。相应的AUC是不同的,CG男性为0.99,TW为0.95。费希尔精确测试显示,CG组和在激素治疗后的TW组的TPR之间有统计学上的显著差异(表4)。分类概率在图2中表示。
图2预测为男性的概率箱线图
单变量分析
感兴趣区域分析在表5和图3中总结。简而言之,使用严格的α校正,TW在CHT治疗后和CG女性在双侧壳核中没有差异。在脑岛上,TW在CHT治疗后的体积大于CG女性。TW在CHT治疗后和CG女性的脑岛和壳核体积均低于CG男性。相反,TW在CHT治疗前在两个ROI都比CG女性有更大的体积。有趣的是,与CG男性相比,TW在CHT治疗前在壳核中的体积也更大。TW在CHT治疗后与治疗前相比,两个感兴趣区的体积都较低。与CG女性相比,CG男性在两个感兴趣的区域都显示出更大的体积。探索性的全脑分析结果可以在补充表S4中找到。一般情况下,忽略患有精神疾病后并不会改变研究结果(见补充表7和8)。然而,由于样本量有限,得出结论时应谨慎。
图3 单变量灰质分析具有显著性的脑区
4.讨论
本研究开发了一种基于超参数优化的支持向量机分类器,基于结构MRI图像对生理性别进行准确分类。分类器在一个健康的CG集上训练,在健康CG个体和患有MDD的CG被试的验证集中表现得同样好。当将相同的分类器应用于TW的结构MRI数据时,支持向量机的TPR要低得多,导致对TW(男性)的生理性别分类错误更多,明显更倾向于他们的心理性别(女性)。此外,关于TW(图2)的分类概率的描述性统计显示了在CG中观察不到的预测不确定性的模式。因此,作者的结果揭示了TIs生物精神病学中的两个重要方面:(1)激素治疗对脑结构的影响;(2)TI的心理困扰(即抑郁)、激素治疗以及特征上的分离。
作者的结果重复了以下发现,即生理性别在TIs中的错误分类越来越多。这可能会鼓励进一步调查TW中错误分类增加的原因。最值得注意的是,与之前的研究相比,作者的结果可以排除受到并存抑郁症和抗抑郁药物的影响。考虑到健康CG被试的第一个验证集的结果在患有严重抑郁症的CG患者验证集中重复,该分类器对于存在来自精神疾病(如MDD和药物治疗)的噪声也是可靠的和健壮的,而这些疾病也与大脑结构变化有关。
与其他生理性别分类器相比,本文的生理性别分类器具有更高的外部效度。首先,它在对照组和MDD患者身上进行了测试,准确率很高,非常相似。其次,SVM在不同地点收集的大样本上进行了训练。因此,在保持性能和精度的同时具有更强的泛化能力,表明了其对噪声的鲁棒性。目前的工作重点研究了该支持向量机在TW上的首次应用。与健康的CG对照组相比,在TW中越来越不准确。探索性分析显示,这种不准确性在接受激素治疗的TW中尤其明显。
虽然本文TW在CHT治疗前的样本量很少,但目标是区分CHT治疗前后的大脑结构性变化,并将其与CG女性和男性进行比较。作者的结果显示大脑结构的改变取决于TW的治疗状态。TW在CHT治疗前的脑岛和壳核的体积大于CG女性,而治疗后右侧脑岛的体积大于CG女性的体积。与CG男性相比,TW在CHT治疗前的壳核体积较大,而治疗后壳核和脑岛的体积均较小。因此,与CG男性和女性相比,TW在治疗前后显示出大脑结构的变化。
TW治疗前后的详细分析显示,与CG女性相比,治疗后的大脑结构改变不那么明显。治疗后两个感兴趣区的体积都减小,全脑分析也是如此。这表明CHT导致了TW的大脑结构进一步女性化。这一结果与先前的纵向研究相吻合,该研究显示CTH治疗后TW皮质厚度减少。先前研究表明,与CG个体相比,脑岛的结构和功能改变与TIs相关,脑岛与身体和自我感知有关。在行为上,TW感觉到他们的生理性别和心理性别之间的不一致,伴随着脑岛的变化。
多项研究表明壳核的脑结构改变与TW有关,与治疗状态无关。作者检查了不同治疗状态下的壳核体积。结果表明,治疗前壳核体积高于CG男性和CG女性,而治疗后体积低于CG男性。然而,目前尚不清楚CHT是如何影响TW的这些结构改变的。需要进行纵向检查以揭示特定区域的结构改变,以评估CHT对脑结构的影响。
单变量和多变量联合的方法表明在检测TW时,CHT相关的准确性较低。结果表明,TW的大脑结构既不符合他们的生理性别(男性),也不符合他们的心理性别(女性)。这意味着跨性别者是有生物学基础的。此外,这一证据可用于性别焦虑症治疗过程中的心理教育。性别焦虑症的诊断更新到DSM-5,以允许在由于生理和心理性别之间的不一致而遭受痛苦的情况下进行治疗。作者的结果可以缓解跨性别者患者感到内疚或羞愧的情况下的痛苦。
根据这一观点,荷尔蒙分泌过程、大脑结构发育和性别认同的发展是交织在一起的。宫内荷尔蒙推动性别认同的发展,而不是社会学习过程。由于睾酮的作用,男性的体貌在怀孕的前三个月形成,而女性的身体是在这一时期由于缺乏雄激素而发育的。虽然生殖器官的成熟或多或少仅限于怀孕的前三个月,但大脑的发育在整个怀孕期间都在继续。怀孕三个月后荷尔蒙的影响不会改变生理性别,而是心理性别,因此可能导致两者的不一致。由于荷尔蒙的影响改变了性别认知和大脑结构,CHT治疗后可能会导致TW组的错误分类。单变量数据确实显示CHT与大脑结构的变化有关。以前的一项研究显示,即使在未经治疗的TW中,生理性别的错误分类也会增加,这一点作者不能从统计上支持,因为未治疗组的样本量很小(N=8)。后续研究应跟进这一效应,增加未治疗的TW样本量。还可将第二个对照组进行扩展(接受激素治疗的女性),用来澄清错误分类是否仅仅是治疗的效果。
目前的SVC为生物精神病学的研究提供了一种新的工具。许多精神疾病的患病率在生理性别中往往高于另一种。例如,生物学意义上的男性自闭症患病率高于生物学意义上的女性。因此,有人假设女性自闭症患者的大脑结构可能与男性相似。之前的一项研究开发了一种使用结构性MRI扫描的生理性别分类器,并将其应用于自闭症患者,该研究确实表明,女性自闭症患者生理性别的错误分类增加了。因此,生理性错误分类可能表明异常的生物性发育参与了这类神经发育障碍。未来的研究可以使用作者的分类器来测试其他患病率性别不平衡的临床诊断中的错误分类,如进食障碍、物质使用障碍或焦虑症。
局限性
本文采用重复嵌套k折交叉验证。在没有外部验证样本的情况下是一种适当的方法,可以产生稳健的估计。然而,不能排除其他策略可以产生其他学习模式,从而影响对TW个体的预测。此外,由于本文的TW样本量很小,需要进行复现。为了证实作者得到的结果是与激素治疗有关,需要更大的样本和对跨性别者的研究(生理性别女性)。未来的研究应该进一步剖析抑郁引起的性别焦虑症的影响,以及处于TIs状态的激素治疗的影响。最后,根据目前的数据,作者不能得出确切的结论,为什么作者的分类器对女性的敏感度更高。还需要进一步的研究来调查男性和女性在CG中的分类表现是如何与性激素相关的。
总结
本文关注于一项特殊的群体,即生理和心理性别不一致的跨性别被试。在研究中,基于顺性别者健康被试的大数据,构建了可以对生理性别进行分类的支持向量机分类器,并将其应用于跨性别者的分类中,发现分类准确率显著降低。同时结合单变量的分析方法,表明跨性别者的大脑结构既不同于顺性别男性,也不同于顺性别女性。选题十分有意义,未来的研究可以使用其来测试其他患病率性别不平衡的临床诊断中的错误分类,如进食障碍、物质使用障碍或焦虑症。
原文:Biological sex classification with structural MRI data shows
increased misclassification in transgender women
微信扫码或者长按选择识别关注思影
如对思影课程感兴趣也可微信号siyingyxf或18983979082咨询。觉得有帮助,给个转发,或许身边的朋友正需要。请直接点击下文文字即可浏览思影科技其他课程及数据处理服务,欢迎报名与咨询,目前全部课程均开放报名,报名后我们会第一时间联系,并保留名额。
第十四届磁共振脑网络数据处理班(重庆,7.26-31)
第三十届磁共振脑影像基础班(南京,7.31-8.5)
第十届脑影像机器学习班(南京,6.30-7.5)
第十二届磁共振弥散张量成像数据处理班(南京,6.18-23)
第二十届脑电数据处理中级班(重庆,8.9-14)
小动物磁共振脑影像数据处理班(预报名,南京)
第二十一届脑电数据处理中级班(南京,9.7-12)
第七届眼动数据处理班(南京,7.26-30)
脑电信号数据处理提高班(预报名)
脑磁图(MEG)数据处理学习班(预报名)
思影科技功能磁共振(fMRI)数据处理业务
思影科技弥散加权成像(DWI/dMRI)数据处理
思影科技脑结构磁共振成像数据处理业务(T1)
思影数据处理业务三:ASL数据处理
思影科技脑电机器学习数据处理业务
思影数据处理服务五:近红外脑功能数据处理
思影数据处理服务六:脑磁图(MEG)数据处理
招聘:脑影像数据处理工程师(重庆&南京)
BIOSEMI脑电系统介绍
目镜式功能磁共振刺激系统介绍