神经网络科学中的零模型

注释:

零模型基于态学数据随机化或从个已知的或指定的分布中随机抽样,数据的某些元素保持不变,允许其他元素随机变化产⽣新的组合。随机化的⽬的是产⽣⼀种在缺乏特定⽣态机制的情况下预期的格局”。

近年来,成像和追踪技术的发展为大脑连接体的重建提供了越来越详细的信息。伴随着分析技术的进步,使得严格辨别和量化脑网络结构的重要功能特征成为可能。零模型是一种灵活的工具,可以有选择性地保留大脑网络的特定架构属性,同时系统地随机化其他特征,对感兴趣特征的存在或大小进行统计基准测试。这里我们描述了连接体零模型的逻辑、实现和解释。介绍了构建零网络的随机化和生成方法,并概述了其用于统计推理的网络方法的分类。我们强调了零模型的范围——从控制少量网络属性的自由模型到概括经验网络的多个属性的稳健模型——这些模型使我们能够实施和测试关于大脑网络结构和功能的详细假设。我们回顾了模型在网络神经科学应用中的新兴场景,包括空间嵌入网络、注释网络和相关衍生网络。最后,我们考虑了零模型的局限性,以及目前该领域的未解问题。

连接组学革命已将重点转移到大脑如何作为一个网络和集成系统发挥作用。现在,了解大脑的连接原理是多个研究所、期刊和资助计划的首要目标。这一研究的核心是大脑结构和功能的图模型,其中神经元素(如神经元、神经元群体或灰质区域)表示节点,它们之间的连接或相互作用表示边。将神经系统编码为图,使我们能够量化和阐明对大脑功能重要的结构特征。

成像技术、分析技术和数据共享的发展为我们提供了前所未有的详尽和深度描述神经系统的机会。在过去的15年里,来自多个物种、重建技术和空间尺度的趋同发现指向了一组可复制的核心网络特征。这些特征包括连接剖面的特异性,重尾度分布,有一小部分连接良好的hub节点和紧密连接的网络模块。总的来说,研究表明,这些网络特征促进了功能分离和整合之间的平衡。

我们如何证明大脑网络的特征比偶然预期更突出?这个网络特征是基本特征,还是其他特征的副产品?这一特征的量级可以归因于一种特定的生成机制吗?现代科学对复杂系统的发现越来越依赖于复杂的统计推断方法。关于重要的和不重要的特征的理论被运用到空模型中--拥有某些特征而不拥有其他特征的大脑网络的替代实现。对真实网络和零网络的系统比较使研究人员能够理清兴趣特征之间的依赖关系,并揭示兴趣特征的存在或大小在多大程度上是由其他特征引起的。然后,新的发现被纳入理论,促使现有的零模型的修改。通过逐步构建更严格的零模型来完善理论的过程,让我们能够有机地从细微的理论角度理解那些在统计上意想不到的,但在大脑网络中可能具有重要功能的特征。

在本文中,我们阐述了网络神经科学中零模型的逻辑背景。我们首先描述了关于网络特征假设的实现过程。然后,我们开发了一个用于统计推断分类的网络方法,并从用户的角度进行了讨论。我们强调零模型是对更广泛的可能网络空间进行采样的过程,并最终成为对感兴趣的特定特征统计上的意外性进行基准测试的工具。最后,我们考虑如何将这个灵活的框架应用于非标准数据类型和该领域的新兴问题,如基于相关的网络和注释网络。本文发表在Nature Reviews Neuroscience杂志。(可添加微信号siyingyxf18983979082获取原文,另思影提供免费文献下载服务,如需要也可添加此微信号入群,原文也会在群里发布)

思影曾做过多期脑网络相关文章解读,结合阅读,加深理解,感谢帮转支持(直接点击,即可浏览,加微信号siyingyxf18983979082获取原文及补充材料):

重放,默认模式网络和记忆的级联系统控制网络和hubs 

Nature Neuroscience:网络神经科学

PNAS:节食可调节年轻人脑网络的稳定性

网络阈值和加权对结构脑网络的影响 

复杂大脑网络的结构和功能
人脑的连接性中心节点促进了人脑网络的模块化 
大脑状态的重构与认知行为之间的映射 
大脑是一种什么样的网络? 
大尺度功能脑组织结构:6个主要原则 


脑网络的小世界属性 

图论方法在大脑网络中的应用 

大脑网络结构、功能和控制的物理学 

脑网络研究中的图论指标详解

从宏观尺度脑网络的角度看结构--功能关系

图论在静息态和动态脑连接评估中的应用:构建脑网络的方法

脑网络组织的经济性

儿童神经认知网络的动态功能连接 
动态功能连接:前景、问题和解释
Nature reviews Neuroscience:认知加工相关的默认网络
自闭症研究中的默认网络
默认网络:最新的解剖、生理研究及其研究发展过程中的新观点

DMN:大脑的默认网络

脑网络核心节点的发育

抑郁症,神经影像学和连接组学

重度抑郁症多成像中心的泛化脑网络标志物

Biological Psychiatry:精分患者大脑的组织体积变化与脑网络

Neuron:从简单映射到多维网络

脑网络视角下的精神分裂症

基于人脑连接组学将疾病症状映射于脑网络

大脑连接障碍中跨脑疾病的连接现代物理评论:大脑网络中的动力学控制
图论在识别人脑网络连通性模式中的应用

网络神经科学中模型的性质和使用

动态脑网络与创造力

网络的零模型

假设你访问了一个新的网络,它代表了一个以前未被研究过的物种的大脑,或者是一个已被充分研究的物种的大脑,现在以前所未有的细节对其进行重建。使用网络科学的方法,可以计算关于网络的统计信息,如其特征路径长度(所有节点对之间最短路径的平均值)或其聚类系数(一个点的邻接点之间相互连接的程度)。你会发现该网络的路径长度为2.5,聚类系数为0.3。这些网络特性对于您的网络是特殊的和特定的吗?它们的量级是出乎意料的大还是小?它们会不会只是碰巧发生在一个大小相似的随机配置网络中?

网络神经科学家面临的挑战是衡量一个网络特在统计上的预料之外程度。许多网络特性依赖于更简单的特征,如节点的数量(网络大小)、可能存在的边的比例(网络密度)和每个节点上关联的边的数量(度序列)。生物体、种群或实验条件之间的拓扑差异可能被这些基本特征上的微小差异所掩盖或过分凸显。通过与零模型比较得出:确定一个感兴趣特征(如路径长度或聚类)的主要推理过程是依据我们的网络拓扑结构,而不是其他特征(如密度)。

1概述了图原假设检验的过程。网络特征(x,如路径长度或聚类系数)首先在观测网络(红色)上计算。为了评估该特征的统计意义,我们生成了一组零网络(蓝色),它们保留了观测网络的一些属性(在本例中为密度)但系统地破坏了其他属性(在本例中为拓扑结构)。然后,我们为每个零网络计算相同的网络特征,在该特征是由于密度而不是拓扑结构的零假设下,生成特征xxp)的分布。如果感兴趣的特征x在观测网络中显著大于或小于零网络,这就证明了特征x可以用零网络中没有保留的属性来解释。例如,如果我们发现观测网络始终比具有随机拓扑结构但保留密度的空网络显示出更大的聚类,我们就可以认为:观测网络中的聚类是由于拓扑结构引起的,而不是密度引起的。p值为分布xp大于或等于x的的概率。

生成网络特征的零分布     

对观测网络的图论分析(红色)可以得到所需的特征x如路径长度、聚类或模块化。矩阵中的红色元素表示存在连接,白色元素表示没有连接。为了确定该特征在统计学上是否出乎意料,我们生成一组零网络(蓝色),它保留了表示原假设H0的观测网络的一些期望属性(如密度),但随机化了表示假设H1的其他属性(如拓扑结构)。对每个零网络重新计算相同的特征x,使我们能够在零假设下构造特征xp的分布,即特征x的大小是归因于保留的特征属性,而不是归因于随机属性。然后,通过计算xpx更大的概率Pr来估计p值。该图是使用公开的扩散MRI和功能MRI数据集生成的,共包括70名健康被试。
零模型的普遍性     

零模型是网络推理的基础,以至于它们被有效地归入多种网络测量方法的定义中。例如,用来衡量聚类(C)与路径长度(L)比率的小世界系数(σ),σ的计算方法是根据一组随机网络(CrLr)中的平均值对每个度量进行归一化:

在另一个示例中,模块化统计量(Q)捕获了在某些分区(c)中社区内连接(Ai,j)的显著或预料之外情况。因此,统计量必须根据一个零模型来定义,该模型量化了社区内连接的期望密度(Pij):

尽管存在其他替代公式,但保留度的模型通常用作零模型,包括符号网络和相关派生网络。
作为最后一个例子,rich club系数量化了网络中高度节点之间的连接比偶然预期的更紧密的趋势。归一化系数(φnorm)计算为网络中高度节点之间的连接密度(φ)与具有保留度序列(φrand)的随机网络总体中高度节点之间的连接密度之比:

总的来说,小世界、模块化和rich club这些例子——证明了在网络神经科学中,零模型是多么根深蒂固。他们还表明,零模型并不总是用于测试和拒绝零假设。相反,它们可以被更广泛地用于归一化或基准化与网络总体相关,其中一些属性被控制或保留的图统计量。换句话说,零模型不仅仅只用于生成p值,还可以用于计算z统计量或标准化度量。换句话说,空模型不需要专门用于生成 p 值,还可以用于计算 z 统计量或标准化度量。在想要比较不同大小或密度的图形的情况下,这尤其可取,例如在不同的空间尺度或用个性化分割重建的连接组上使用不同方法重建的模式生物之间的比较分析。



随机和生成模型       

在网络神经科学以及更广泛的网络科学中,存在两种不同的方法来构建零网络。所有的零模型都通过随机观察到的网络属性(如拓扑结构)来体现一个零假设,同时保留其他属性,如密度和度。模型的不同之处在于它们如何实现这些假说(图2)。

随机和生成模型的对比

也许最常见的网络随机化方法是重布线。重布线模型通过随机重布线观测网络,是蒙特卡罗采样法的一类。随机选择一对边(图2a),然后互换,这样每条边连接着一个""节点和一个""节点。例如,如果我们选择两条边A-BC-D。互换可能导致新的边A-CB-D其目标是生成一个随机网络,该网络的节点和边的数量与观测网络相同,从而保持密度相同。重要的是,由于边是互换而不是移动,因此节点边的总数不会变。因此,每个节点的度被保留下来,重布线的网络被称为具有与原始网络相同度的序列。这种类型的null有时被称为"配置模型"Maslov-Sneppen重布线。正如我们在下一节所讨论的,重布线的零模型可以通过在其他约束条件下进行边互换来保持观测网络的附加属性,例如成本、方向性、模间和模内边的比率和边权重。

重布线模型改进观测网络以生成零网络,而生成模型则从头开始构建零网络(图2b)。零网络通常用节点和/或边的子集进行初始化。然后,根据零假设的部分布线规则,伪随机地添加新节点和/或边。直到零网络的大小和密度与观测网络相同时,构建过程才终止。具体的布线规则可以有多种形式。可以完全随机放置(Erdős–Rényi随机图),以最小化网络的总边长度(布线成本),或者最大限度地提高具有类似连接特性或类似微尺度属性的节点之间的同质连接。更广泛的生成增长模型也可能体现一些将节点添加到网络中的机制,例如优先连接,其中新节点更有可能连接到具有更大度的现有节点。尽管生成模型的主要目的是揭示经验网络的结构和增长的潜在原则,但它们也可以用于以类似于基于随机化的零模型的方式进行假设检验。在其他领域,如时间序列分析,有时从以下角度讨论这种区别:使模型适合数据的典型实现(类似于生成模型);通过与数据匹配的一个或多个属性产生的约束实现(类似于随机模型)。通过评估驱动观测网络特征的多重竞争性假设机制,生成模型还可以比显著性检验更好地用于模型识别。例如,生成模型已被用于测试大脑网络形成的竞争性说法:模型A(边的放置仅是为了最小化布线成本),相对于模型B(边被放置在具有重叠连接特征的大脑区域之间)和模型C(边被放置在具有类似基因表达模式的区域之间)。然后通过评估每个备选模型(体现不同的生成机制)对观测网络特征的概括程度来比较模型。这在概念上类似于将大脑网络表述为动态系统的模型识别,例如动态因果建模,其中对动态神经回路相互作用的相互竞争的解释进行了测试,以确定最佳拟合或最精简的模型,或将竞争假设分组为不同的机制或模型族。

尽管在实现上存在差异,但随机和生成模型形成了一套连贯的分析工具,用于制定和完善有关网络结构的假设。在随机模型中,我们系统地随机化那些我们假设对我们研究的网络特征很重要的因素,并保留那些假设不重要的因素。在生成模型中,我们系统地添加我们假设为重要的最小因素集。从这个意义上讲,随机模型和生成模型之间的差异类似于统计学中非参数检验和参数检验之间的差异。对于生成模型,就像在参数检验中一样,我们明确定义了数据生成的过程,并假设零分布可以由一小组参数捕获。对于随机模型,如在非参数检验中,我们不做关于零分布的假设,而是使用一些随机过程从观测数据中组合出一个零分布。随着时间的推移,随机模型逐渐变得更加稳健,它们有助于缩小假设范围,并为生成模型提供有用信息。

到目前为止,在本文中,我们主要关注的是通过重布线或生成模型对网络拓扑结构进行随机化。然而,在网络构建和分析的其他步骤中,零模型也可以用于分离网络属性的相互依赖关系,下面的注释网络和相关网络的零模型部分将详细对其展开讨论。例如,在功能网络构建过程中,使用相关系数来量化成对神经生理时间序列之间的关系,会存在大量全连接的三元组节点(由于传递性);在这种情况下,涉及时间序列随机化的零模型可能比网络拓扑随机化更现实可行。类似地,在评估成对节点脑图之间的关系时,其中一张图可以在节点特征级别直接随机化,同时保留某些属性(例如空间自相关),而无需在边特征级别重新连接底层网络。

网络的采样空间

鉴于有许多可供选择的零模型,我们如何选择适当的模型作为观测网络的参考框架呢?图3展示了一个观测网络,以及三个保留网络特性逐渐增多的不同零模型。第一个零模型是一个随机图,只保留密度。第二个零模型是Maslov-Sneppen重布线零模型,保留了密度和度序列。注意,与随机零空间相比,重布线的零空间具有显著的水平和垂直条纹,这与观测网络中的条纹类似,因为在观测网络中作为hubs的节点在重布线的网络中仍然是hubs第三个零模型,保留了网络的密度、度和总的布线成本,显示了与观测网络类似的结构。换句话说,当增加对零模型的约束时,我们将产生更多关于原始图的真实表示,从而产生一个更稳健的零模型。这导致了更严格的测试,以识别更细粒度的影响,这可以解释原始数据中方差的逐渐减少。这个例子说明了零模型的两个重要特性。首先,零模型存在于一个范围内,范围从不确定的零到稳健的零,这取决于施加的约束。其次,零模型是一种系统地对更大的潜在网络空间进行采样的方法,并将观测网络置于这个空间中。      

到目前为止,我们已经隐含地讨论了硬约束;也就是说,特征被精确地保留下来,比如网络的度序列。然而,存在无数在""约束下运行的零模型,这些约束只能近似满足。一个简单的例子是如何将类似Maslov-Sneppen的重布线应用于加权网络,以近似保持每个节点上关联边的权值之和(强度序列)不变。这个过程第一步是保留度序列的重布线,第二步是权重互换,在该步中,由于边权重由不能完全互换的连续值组成,所以很难达到准确收敛。尽管在每个单独的网络中都没有完全满足约束条件,但平均而言,在整个零网络的集合中,这些条件是得到满足的。

一系列零模型     

更一般地说,构建零模型的过程可以认为是从具有相关特征的更广泛的可能网空间中进行采样(图4)。这个多维网络形态空间由代表特定网络特性的或特征生成。这个空间中的每个点或位置都代表着不同的网络形态,其中一些可以在所需约束条件下实现,而另一些不能。该空间中的邻近性反映了网络形态之间的相似性。零模型约束的数量和严格程度决定了该空间中将由零模型实例化填充的部分;例如,严格的模型将位于经验网络附近,而较宽松的模型将位于更远的地方。因此,无论是通过重布线还是生成机制实现的零模型,都是从该网络形态空间的不同部分进行系统采样并为所需网络特征生成零分布的方法。探索这个空间使我们能够量化不同的约束和生成机制对观测网络的特定特征的贡献。     

由此推论,采样空间的大小将影响零模型实现的可变性。一般来说,带有附加约束的模型在理论上应该表现的更相似,从而覆盖零模型采样空间的一小部分。4展示了这一概念:零模型abc采样的网络空间越来越大,导致零分布的变化越来越大。一个重要的方法论问题是,零模型是否对目标空间进行均匀采样。模型保留一个特征并随机化另一个特征这一事实并不意味着它对所有可能的空间进行了详尽的采样。这与在实践中如何实现零模型直接相关,我们将在下面关于零模型的限制部分中考虑这一点。     

归根结底,零模型没有对错之分。零模型应该是特定于研究问题的明确且可证伪的零假设的体现。变量可以是一项研究中的主要自变量,也可以是另一项研究中需要控制的协变量。我们下一节中将详细讨论的一个典型示例是几何嵌入和布线成本对大脑网络架构的贡献。更广泛的零空间是一个强大的工具,可以从多个角度探测观测网络,并解析不同的网络特性对感兴趣特征的贡献(图4)。从这个意义上说,同时使用多个null值对答案进行三角测量可能是分析网络最全面和信息量最大的方法。

零模型的抽样空间。

空间网络的零模型

在分析大脑网络拓扑结构时,要考虑的最重要的特征可能是几何形状。大脑是一个空间嵌入系统,具有有限的代谢和物质资源,由此产生了一种普遍的短距离连接,这种连接可能比长距离连接的成本更低。实际上,多种成像模式和追踪技术表明,如果神经元在物理上靠得更近,比相距更远的神经元更有可能相互连接,并显示出了更强的连接权重。因此,连通性和几何形状从根本上是相互交错的,因此需要零模型来分析它们各自的贡献。

平均而言,使用标准重布线模型的主要困难在于,原始的交换会将边放置在相距较远的节点之间,从而产生零网络,其布线成本远高于观测网络。一种方法是使用带有附加约束的迭代重布线。早期的研究提出将观测网络格化”;这里,交换边时考虑了网络节点的空间位置。候选边只有在将边放在空间上相邻的邻居之间时才会执行交换,从而创建格状网络。虽然网格化减少了重布线网络的布线长度,但该算法创建的重连网络除了密度和度序列外,还能精确匹配观测网络的边长分布和权重-长度关系。进一步的替代模型使用了所谓的空间重定位nulls,其中节点的空间位置被改变,但拓扑结构不变,使研究人员能够评估观测网络的特征是否是由节点之间的空间关系所驱动的,而不是拓扑结构所驱动的。

总的来说,几何nulls使我们能够量化来自空间嵌入的拓扑结构的比率。例如,最小化布线成本的纯几何模型可以再现大脑网络的多种特征,包括hubs节点、网络中心性和模块化。因此,这些nulls值可以用来测试网络中的附加结构是否可以通过特定的布线规则来解释。特别是,生成模型可以包括几何和拓扑规则,在这些规则中,如果边的布线成本最小,而且它们还能优化其他拓扑特性,如同质性,那么这些边就会被依概率性地放置。在这些模型中,几何和拓扑约束的影响被参数化调整,使研究人员能够滴定和评估每个约束对整个网络架构的贡献。最近,生成模型已经开始考虑几何、拓扑和网络节点的局部生物学注释的联合影响,例如基因表达或层次划分,这是我们在下一节中考虑的问题。



注释网络的零模型

大脑的图形表示刻意抽象出区域之间的微尺度差异,从而产生同质节点。然而,网络神经科学越来越关注网络结构与区域空间标注之间的关系,例如神经元形态、基因表达、受体谱、层次划分、髓鞘形成和内在动力学。典型的比较可能涉及跨脑区关联的单个区域的网络属性(如度数)及其微尺度标注(如树突棘的平均数量)。然而,在估计相关系数的p值时出现了一个重要的问题。即,标准参数方法假设两个向量来自不相关的二元正态分布,而非参数(基于朴素置换)方法假设向量的元素是可交换的。数据点之间的多种形式的依赖性违反了这种独立性假设。首先,成像数据的空间自相关使得相邻位置之间的解剖和生理测量值相似。其次,同伦对称性导致大脑左右半球内相应位置之间的测量相似。最后,分析的空间分辨率是任意角度的,这就导致p值和效应大小都依赖于所考虑的区域、顶点或体素的数量。这些限制可以使用控制空间自相关的零模型来解决,包括空间置换试验和参数化数据模型。

空间置换试验,也称为自旋试验通过随机旋转大脑空间标注图的球形剖面来随机化网络结构和空间标注之间的关系(图5)。这些模型利用皮质表面提取过程中产生的球坐标将大脑区域或顶点投射到一个球体上。在球体的随机旋转之后,通过将每个坐标分配给其最近的旋转对应的位置而获得了一个变体。通过对两个大脑半球应用相同的(镜像)随机旋转,空间置换模型(大约)保持了大脑半球的对称性。最终得到的标注图保留了网络结构,保留了标注的空间自相关性,但网络节点与标注的对应关系是随机的(图5)。这个测试最初是在曲面顶点层面开发的,随后扩展到区域层面——即分块数据。值得注意的是,区域层次上空间置换模型的不同实现方式在特定的方法论决策上存在分歧,例如如何处理内侧壁,或者它们是否允许多次分配注释值。

空间置换试验

相比之下,参数化数据模型生成的替代脑图具有预定义的空间属性,如与经验数据集相同的空间自相关性。参数化模型不依赖于数据的球面排列;相反,这些模型使用脑图位置之间的距离矩阵,对随机排列的数据施加空间自相关性——如使用一组简约的参数所描述的那样。已经提出了几种参数化的方法,包括空间自回归模型、平滑随机值以匹配经验变异函数和使用Moran谱随机化的空间特征分解。关于空间置换和参数化数据模型的系统比较,可参考文献49     

与几何模型类似,保留空间自相关的零模型使我们能够知晓网络特征在多大程度上出现在空间嵌入的背景影响之上和之外。因此,这些模型很快就变得无处不在,并且可以应用于广泛的分析问题。其中一个应用是评估一个特定节点属性x(例如度)是否在特定类别的节点中富集(例如在内部网络或细胞结构类别中)。这里的注释(类)是分类变量,零模型可以用来量化属性x的意外程度,同时控制类的大小和空间范围。另一种应用是评估具有相似注释的节点是否显示出了比预期更大的连通性。在这种类型的分析中,将具有特定注释的节点之间的平均连通性与旋转注释构建的连通性的零分布进行比较。更广泛地说,这些方法已经扩展到解决空间自相关在各种生物学问题中的影响,例如神经成像被试的模态内部相关性或基因富集。

如您对脑影像及脑网络等数据处理如脑功能,脑网络或其他模态脑影像数据处理感兴趣,请浏览思影以下链接(直接点击即可浏览),感谢转发支持。(可添加微信号siyingyxf18983979082咨询)

南京:
第三十三届磁共振脑网络数据处理班(南京,10.16-21
第二十二届磁共振脑影像结构班(南京,10.24-29
第七十一届磁共振脑影像基础班(南京,11.12-17
重庆:
第九届脑网络数据处理提高班(重庆,10.13-18
第七十届磁共振脑影像基础班(重庆,10.22-27
第二十八届弥散成像数据处理班(重庆,11.5-10
第六届弥散磁共振成像提高班(重庆,11.17-22
第二十三届磁共振脑影像结构班(重庆,11.27-12.2
北京:
第十届脑网络数据处理提高班(北京,10.20-25
第十一届磁共振ASL(动脉自旋标记)数据处理班(北京,11.3-6

第七十二届磁共振脑影像基础班(北京,11.9-14
第六届影像组学班(北京,11.25-30
第五届R语言统计班(北京,11.16-20
上海:
第二十四届脑影像机器学习班(上海,10.9-14
第三十一届磁共振脑网络数据处理班(上海,10.28-11.2
第六十九届磁共振脑影像基础班(上海,11.4-9
数据处理业务介绍:

思影科技功能磁共振(fMRI)数据处理业务 
思影科技弥散加权成像(DWI/dMRI)数据处理
思影科技脑结构磁共振成像数据处理业务T1)
思影科技定量磁敏感(QSM)数据处理业
思影科技啮齿类动物(大小鼠)神经影像数据处理业务 
思影科技灵长类动物fMRI分析业务 
思影数据处理业务三:ASL数据处理
思影科技脑影像机器学习数据处理业务介绍
思影科技微生物菌群分析业务 
招聘及产品:
思影科技招聘数据处理工程师 (上海,北京,南京,重庆)
BIOSEMI脑电系统介绍
目镜式功能磁共振刺激系统介绍

相关性网络的零模型

连通性通常是用区域属性之间的统计协方差来估计的,如神经活动、基因表达或皮层厚度之间的相关性。相关性网络的例子包括功能网络、结构协方差网络、形态相似性网络、基因共表达网络、神经受体相似性网络和时间分布相似性网络。这些网络在构造上是加权的(一般是有符号的),这表明在二进制拓扑水平上运行的零模型,如重布线模型,可能是不恰当的。特别是,通过关联性构建的网络服从于传递性:如果我们知道边A-BA-C的值,我们就可以限制边B-C的值。重布线可能会以不保留这种传递性的方式交换边——例如,AB之间以及AC之间具有强正相关,但BC之间具有弱或负相关。因此,在这种网络中对边的拓扑重布线可能会导致不可能自然产生相关网络的零网络。换句话说,相关性派生网络需要考虑到传递性和边权重的备选零模型。

可以使用不同方法为相关性衍生的大脑网络创建更现实可行的零模型。一种选择是创建零相关矩阵,使用诸如Hirschberger-Qi-Steuer算法之类的方法,该算法与经验矩阵的平均值和方差相匹配,或者使用保留经验节点度的配置模型。一个更严格的方法是将信号本身随机化。例如,在功能连接的情况下,可以通过使用傅里叶变换将经验时间序列转换到频域、混洗相位系数,并对时域进行逆变换,可以生成替代时间序列。由此产生的替代时间序列保留了功率谱,但随机化了时间依赖性。这也可以用小波变换来完成,这个过程被称为"波形收缩"。最后,图信号处理中的新兴方法可以将傅里叶变换和小波变换等经典信号处理方法推广到网络中。这些方法产生的替代信号可以保持观测网络的平滑度。

除了随机化,替代时间序列也可以用生成方法来创建。例如,自回归模型可以生成替代时间序列,并保留经验数据的时间(自)相关性、功率谱密度、交叉功率谱密度和振幅分布。虽然这些生成模型只保留了时间特征,但最近提出的混合模型也保留了空间特征。这些模型生成保留空间自相关的替代时间序列或同时保留空间和时间自相关的时间序列。除了人类成像数据之外,复杂的多神经元放电率记录零模型可以同时保存跨时间、神经元和实验条件的协方差。

在解剖学属性共变网络的情况下,解剖学测量可被直接随机化(被试内)与时间序列不同,不同参与者的解剖学测量数据点是独立的。从这个意义上而言,替换重采样(bootstrapping)也可以应用于基于相关性的网络,以评估网络特征的可靠性,而不是检验零假设本身(Box1)。注意,使用其他协变量(如偏相关)估计的网络可能不太容易受由传递性引起的边权值之间的相互依赖性的影响。然而,考虑到它们的边代表节点属性之间的统计关联这一事实,这样的网络也应该使用零模型来评估。

Box1 Bootstrapped脑网络

      如果用一个稍有不同的参与者样本来估计结构协方差,所产生的网络会是什么样呢?如果网络节点的属性不同,这将如何影响度序列?更广泛地说,我们对连接性或下游网络统计的估计的置信是什么?这类问题可以用重采样的方法来回答,比如bootstrapping我们在正文中讨论的随机化方法是用来生成网络特征的零分布的,而bootstrapping可以用来生成网络特征的抽样分布并估计其置信区间(见图)。通过随机化,我们试图构建一个体现零假设的某些数据特征的分布,并通过这步来估计P值。通过bootstrapping,我们试图构建置信区间,以识别对样本中数据点不敏感的稳定特征。Bootstrapping由随机抽样和替换观察值组成,以估计网络统计数据的传播策略(例如,重新抽样参与者ABCD可能会产生一个新的样本ACDC)。网络神经科学中使用的许多统计方法大多是产生一个单变量,没有相关的方差或置信区间估计。例如,在一组参与者中,区域解剖测量的相关性引出的单一结构协方差网络。该网络可以通过抽取同等大小的受试者样本进行bootstrapping,即单样本往往包含一些受试者的多个实例,而其他受试者将会丢失。重复采样有助于识别对样本的特定组成稳定或不敏感的边或网络特征。在结构协方差和功能脑网络中,通过保留样本中具有相同符号(即正或负)的边,Bootstrapping已被用于量化网络估计和衍生统计数据的稳定性,以及阈值网络。皮质分区的bootstrapping也被用来估计功能网络的统计方差,并使用功能连接组指纹准确识别个体。最后,网络节点的bootstrapping已经被用来有效地估计和量化大型网络中节点中心性、主题计数和程序列的不确定性。到目前为止,这些应用大多仅限于社会或基因调控网络,但它们在网络神经科学中的应用还有很大的潜力。

      总体而言,这些方法展示了一个重要的点:某些类型的网络可以在构建和分析管道的不同层次上被随机化(图6)。结构网络和注释网络的零模型倾向于对网络本身的边或节点进行操作,而相关性网络的许多零模型还可以在网络构建的早期中进行操作,比如说相关的生理时间序列或解剖特征向量。通过将分析工作流应用于随机输入数据,在网络构建的期阶段应用零模型仍可用于生成派生统计的随机实例。例如,随机化的替代时间序列可用于构建一个相关矩阵、一个二元网络和一个区域节点度map,每一个都是相对于它们的经验对应变量随机化得到的(图6)。另外,经验相关矩阵(或衍生的二元拓扑结构或节点属性)也可以直接随机化(图6)。最重要的是,这些不同的零模型可以同时进行评估,以更全面地评估感兴趣的经验特征。

零模型可以应用在网络构建和分析的不同阶段

零模型的局限性

尽管零模型是网络神经科学中科学方法的支柱,但它们在理论上和实践上都存在着重要的缺陷。网络属性之间的关系可能使其难以区分对整个网络结构的独特和共同贡献。也就是说,一些特征的存在可能会诱导其他特征的存在,使我们不可能在保持其他特征不变的情况下随机选择一个特征。例如,分离的模块和高度连接的hub节点的同时存在,可能会诱导结构性的副产物,如层次结构和rich club。因此,零模型并不总能明确地恢复网络特征之间的因果结构。

更为普遍的是,由于可以自由地构造零模型的谱,因此有必要根据基本假设仔细解释相关结果。过于宽松的模型控制了太少的网络属性,会产生了"稻草人"论点,这些论点很容易被拒绝,但无法准确识别感兴趣的效应来源。相反,过于严格的零模型同时控制了太多的网络属性,最终可能会限制网络结构的采样空间,导致与经验网络的匹配度过高,限制了洞察力。这并不意味着零模型范围的宽松或严格限制是无趣的或不应该被探索。相反,应尽可能将这些限制与其他零模型一起考虑,以全面表征多个网络属性的贡献。

一个相关的考虑是零模型对它们试图探索的空间进行抽样的效果如何。也就是说,零模型可能系统地对目标空间的某些位置进行欠度采样或过采样。一个相关的例子是注释网络的自旋检验,它只探索保留空间自相关的网络空间的有限区域。通过精确排列区域注释,与参数化生成模型或基于小波的数据先清洗再排列的重采样方法相比,自旋测试的可行性更低。这个例子还强调了随机化如何覆盖了零模型采样空间的更严格的部分,而可比较的生成模型实现显示出更大的可变性,同时在无限采样的限制中保留了感兴趣的数量。

零模型的多样性也给用户带来了实际问题。零模型的算法实现往往需要特定的假设,这可能会造成结果存在非显著差异。例如,不同的自旋测试在如何识别感兴趣区域的质心,以及在空间随机区域坐标映射到原始区域坐标时是否允许重复赋值方面存在差异。同一零模型的不同实施方案之间的这种差异可能会导致推断的不同。

即使在特定的零模型中,算法实施的细节也很重要。尽可能统一地对零模型实例进行抽样是很重要的,以确保得到的统计数据不存在偏差。例如,自旋试验的早期实现简单使用了围绕(x,y,z)轴的随机旋转;然而,这导致了对某些旋转的过采样,不同于基于标准正交旋转矩阵QR分解的无偏方法(将旋转矩阵分解为正交矩阵Q和上三角矩阵R)。上述两个关于算法实施细节的例子都高度揭示了一个重要的问题:仅仅决定随机化什么网络特征是不够的;决定如何实施这种随机化也很重要。这强调了共享实现所选零模型底层代码,并清楚报告相关细节的重要性。

我们最后指出,网络神经科学中的一些问题不一定需要用零模型进行基准测试。如果一项研究的目标是生成一种大脑网络特征来区分不同个体(如患者和对照组)或预测某些外源性特征(如症状严重程度)的个体差异,那么更重要的是证明该特征预测了未见数据中的个体差异,而不是确认该特征在统计学上是不可预料的。换句话说,比较经验数据和替代数据中的特征并不能提供有关其临床或更普遍的预测效用的信息。



展望和结论

在这篇评论的最后,我们考虑了网络神经科学中下一代推理方法的突出问题。随着该领域从大脑网络的描述性统计转向对生成机制的理解,零模型将成为提取最小规则或约束集的关键,这些规则或约束可以简略地解释大脑网络的标志性特征及其系统发育和个体发育。我们设想,几何和微架构约束与现有新兴拓扑模型的集成将导致更完整和更强大的nulls,从而可以更准确地查明观察到的现象的起源。这些混合模型将有助于评估典型大脑网络特征(如模块化、hubsrich clubs)的相对重要性,并最终阐明将大脑的独特特征与副产物区分开来的特征层次结构这项工作的关键是建立一个范式,在这个范式中,零模型的组合限制了一个或多个特征,以系统地测试哪些特征是作为其他特征的副产物产生的。

一个重要但未被充分探索的方向是,对观测网络进行分项扰动,探索保留许多经验特征的大脑网络的替代实现。在网络神经科学中,零网络通常是通过完全随机化创建的,相反,生成模型通常是预先设定好的。然而,这两个过程都可以逐步暂停,以探索零模型空间中经验网络的邻近区域,从而深入了解大脑网络的随机邻近区域。这样的连接组突变可以为精神和神经疾病的病理扰动提供见解。以这种方式对随机化程度进行参数化调整,可用于系统映射网络空间,并阐明生物约束如何表现为网络特征和结构。

更广泛地说,零模型是在神经科学界和相邻领域建立联系和共同语言的理想工具。事实上,这些方法很多都来自其他领域,如天体物理学、时间序列分析、生态学和生物信息学。网络神经科学的主流框架是使用零模型进行零假设检验。随着预测和交叉验证成为自然科学和工程领域等其他领域的主导框架,一个主要的新领域是制定模型来预测未知数据中特定网络特征的存在和重要程度。从这个意义上说,在样本外验证的生成模型为网络神经科学零模型的持续发展迈出了有希望的一步。

从更务实的角度来看,对多个零模型的结果进行标准化报告将促进更全面的科学交流。我们鼓励读者在自己的工作中探索这些方法;补充表1显示了PythonMATLABR编程语言中各种随机化和生成零模型的现有研究。展望未来,零模型为公开地共享方法和协调分析框架提供了特有的机会。反过来说,这也将促进零模型方法的广泛使用和持续发展。

对于网络神经科学来说,这是一个激动人心的时刻。方法论的快速发展使我们能够以零模型的形式明确定义可证伪的零假设。反过来,零模型又使我们能够提出具体的和越来越多的关于大脑网络结构的问题。零模型的持续发展推动了新发现的产生。在每一步或迭代中,数据都要在越来越复杂的零模型上进行测试,从而激发新的见解,促使理论和方法的创新,最终得到更具信息量的网络特征和零模型。随着推理方法种类的增加,我们对大脑网络结构原理的理解也会随之加深。



如需原文及补充材料请添加思影科技微信:siyingyxf18983979082获取,如对思影课程及服务感兴趣也可加此微信号咨询。另思影提供免费文献下载服务,如需要也可添加此微信号入群,原文也会在群里发布,如果我们的解读对您的研究有帮助,请给个转发支持以及右下角点击一下在看,是对思影科技的支持,感谢!

微信扫码或者长按选择识别关注思影

非常感谢转发支持与推荐
欢迎浏览思影的数据处理业务及课程介绍。(请直接点击下文文字即可浏览思影科技所有的课程,欢迎添加微信号siyingyxf18983979082进行咨询,所有课程均开放报名,报名后我们会第一时间联系,并保留已报名学员名额):

核磁:

重庆:
第九届脑网络数据处理提高班(重庆,10.13-18
第七十届磁共振脑影像基础班(重庆,10.22-27
第二十八届弥散成像数据处理班(重庆,11.5-10
第六届弥散磁共振成像提高班(重庆,11.17-22
第二十三届磁共振脑影像结构班(重庆,11.27-12.2
北京:
第十届脑网络数据处理提高班(北京,10.20-25
第十一届磁共振ASL(动脉自旋标记)数据处理班(北京,11.3-6

第七十二届磁共振脑影像基础班(北京,11.9-14
第六届影像组学班(北京,11.25-30
第五届R语言统计班(北京,11.16-20
上海:
第二十四届脑影像机器学习班(上海,10.9-14
第三十一届磁共振脑网络数据处理班(上海,10.28-11.2
第六十九届磁共振脑影像基础班(上海,11.4-9
南京:
第三十三届磁共振脑网络数据处理班(南京,10.16-21
第二十二届磁共振脑影像结构班(南京,10.24-29
第七十一届磁共振脑影像基础班(南京,11.12-17
脑电及红外、眼动:北京:

第三十九届脑电数据处理中级班(北京,10.11-16

更新:第十三届眼动数据处理班(北京,10.26-31
上海:
第二十五届近红外脑功能数据处理班(上海,10.17-22
第三十六届脑电数据处理中级班(上海,11.13-18
第二十八届脑电数据处理入门班(上海,11.20-25
南京:
第五届脑电机器学习数据处理班(Matlab版本,南京,11.3-8

重庆:

第二十七届脑电数据处理入门班(重庆,10.28-11.2
数据处理业务介绍:

思影科技功能磁共振(fMRI)数据处理业务 
思影科技弥散加权成像(DWI/dMRI)数据处理
思影科技脑结构磁共振成像数据处理业务T1)
思影科技定量磁敏感(QSM)数据处理业务
思影科技啮齿类动物(大小鼠)神经影像数据处理业务 
思影科技灵长类动物fMRI分析业务 
思影数据处理业务三:ASL数据处理
思影科技脑影像机器学习数据处理业务介绍
思影科技微生物菌群分析业务 
思影科技EEG/ERP数据处理业务 
思影科技近红外脑功能数据处理服务 
思影科技脑电机器学习数据处理业务
思影数据处理服务六:脑磁图(MEG)数据处理
思影科技眼动数据处理服务 
招聘及产品:
思影科技招聘数据处理工程师 (上海,北京,南京,重庆)
BIOSEMI脑电系统介绍
目镜式功能磁共振刺激系统介绍