语言是人类和动物根本性区别的标志之一,在一定程度上甚至可以认为语言能力是人与动物的根本性区别(语言与思维是难以分离的)。因为,人类婴儿的大脑是目前已知的唯一能够掌握一门自然语言的系统。它能开发出明确的、象征性的、可传播的知识体系,以丰富地表达外部世界。但是,到目前为止,我们对人类语言的大脑神经基础仍旧难以看到全貌,虽然在近年来的研究中,我们已经发现了大量的与语言处理有关的神经机制(如听觉的双流模型、句法加工模型)等等,但是语言处理是一个相当复杂的过程,在这个过程中不只是语言中核心要素的处理(如词汇、语音和句法)。也包括了语用推理、注意转换等其他过程,因此,面对语言的神经基础这一问题,我们需要更加宏观的视角来看待。
语言神经机制研究中的著名研究者——Peter Hagoort在著名杂志《Science》的 “语言和脑”专刊上发表文章对这一问题从神经生物学角度对语言在单字层面以上的处理进行了宏观分析。在这篇综述中,作者提出了一种基于神经生物学基础的多网络观点。发现了一个比经典的语言神经生物学模型更复杂的相互作用的大脑区域的网络。这是因为语言的使用不仅仅是一个字的处理,更多的是超越了声学或正字法符号所提供的信息。这些符号进入初级感觉皮质,需要多个神经网络的参与,且在功能上不重叠。
正文
语言能力是人类社会的一个重要特征。它使我们能够与同胞交流,积累知识,创造文化实践,并支持我们的思想过程。作者认为,语言是一种复杂的生物-文化混合体(bio-cultural hybrid)。为了理解其复杂的组织和神经生物学基础,我们必须将语言技能分解为基本的构建模块和核心操作模块。
基本构建模块:
包括对说话人使用的一个或多个在语言模式的认知发展中所需要的知识,我们可以将这些基本知识称之为:基本语言要素,如词的意义,其句法特征(如名词、动词,和语法:性、数、格等),阅读中单词的拼写,以及聋人的手语等。除了基本语言要素(Elementary linguistic units, ELUs),还有基本语言操作(Elementary Linguistic operations, ELOs),这些语言操作能从记忆中提取语言要素(例如对词的认知),或者能将这些基本的语言要素生成更大的语言结构(例如,词形构成、复合或动词屈折变化以及句子层次意义的建构等方面)。
此外,将基本语言要素和基本语言操作结合起来所产生的命题必须与它所处的实际或想象的情境相联系,以建立它的真值。例如,如果作者们说“期刊的编辑热爱论文”,就造出了一个完美的句子,但只有当“编辑、期刊和论文”三个名词能被连接到特定的符号时,命题的对错才能揭晓。
虽然人类语言在进化的前期可以被识别,但就其全部能力方面,它显然是具有人类特征的。尽管它很复杂,但大多数孩子在生命的最初几年里就掌握了这种能力的核心,这是发生在没有接受正式的教育,甚至在他们学会系鞋带或做简单的算术运算之前。
这表明,人类大脑的神经生物基础为儿童提供了一定的语言准备。在这方面,一般认为能使人类具有独特性的一个功能特征是,作者们能从序列顺序中推断出树状结构的能力。树状结构是由Wilhelm Wundt引入的一种代表性格式,它与层次结构的概念有着错综复杂的联系。这一点在单词的形态构成和短语的层次解释等方面得到了证明(如图1)。这种计算层次结构的倾向不仅仅局限于语言,而且可以推广到认知的其他领域,如进行规划和音乐。
图1树状结构,是构词和解释短语、句子特征的有效手段
(A)单词“粗心”由语素“care”(N,名词)、“less”(A,形容词标记)和“ness”(N,名词标记)组成。最后一个语素决定了它作为名词的地位。
(B) 31名被试中有30人认为“第二个绿球”是指位于左三位置的第二次出现的绿色圆形,而不是位于第二个项目的绿色圆(第二个项目)。这是一个层次解释的结果,这个短语指的是第二个绿球。括号中的表示形式在形式上等价于树结构。(C)在有球和三角形的数组中,99%的被试都认为“第二个蓝球”是第二次出现的蓝色球(左五),而不是第二次出现的蓝色项目且形状为球形(左三)。
古典主义观点及其缺陷
在很长一段时间里,对语言的神经生物学基础的理解来自于19世纪末和20世纪初神经病学家的观点,这些观点在后来被进一步解释和扩展。
根据这个经典的模型,人类语言能力位于左外侧裂周区皮层,在额叶和颞叶之间有严格的分工。Wernicke的左颞叶皮层区域被认为有助于语言理解,而Broca的左额下皮层区域(LIFC)被认为支持语言产生。弧形纤维束连接这两个区域。尽管这种模式仍然有影响力,但它被证明有严重的局限性,而且在很大程度上是错误的。一些关键的问题如下:
(i)Broca区和Wernicke区界限不清,并未形成自然的神经解剖学成分。此外,它们被进一步细分为多个区域,具有不同的细胞构造剖面和受体结构。
(ii)功能性磁共振成像(fMRI)和损伤研究表明,语言相关皮层的延伸程度远远超过这种假设,包括颞叶皮层的大部分、顶叶皮层的一部分,以及超过Brodmann 44和45区左额下皮层区域。此外,语言并不像以前认为的那样是严格的左脑侧化(如图2)
(iii)额区和颞区都参与语言理解和语言生成。
(iv)语言相关皮层的连通性比经典模型假设的要广泛得多,当然也不局限于弧形纤维束。
(v)小脑和皮层下结构,如丘脑和基底神经节也起着重要的作用,尤其是在说话时间和顺序的微调方面。
经典模式主要基于单字处理,认识到这点很重要。语言具有超越单个单词的组合机制的观点虽然在语言学界是基础知识,但在语言的神经基础方面,这一认识是缺乏的。这可能在一定程度上解释了为什么经典模型严重低估了对语言很重要的大脑区域和纤维束。
人类语言的一个特点就是能够以新的方式组合单词。这种结合是通过颞顶叶皮层与后脑皮层中Broca区与左额下邻近皮层之间的动态交互作用来实现的。这些区域之间的相互作用保证了从记忆中检索到的词汇信息被统一为连贯的多词序列,并且具有整体的句法结构和语义解释。
图2 语言的神经基础结构
(A)连接语言相关区域的纤维束。
(B)在一项有204名被试参与的功能磁共振成像研究中,与低水平的基线相比,听句子和读句子的常见激活。
神经可塑性
另外,与语言相关的皮层在某种程度上是可变的。最近的研究表明,在一定的条件下,典型的外侧裂周区皮层也会参与进来。语言处理发生在先天失明个体的枕叶皮层。虽然准确的计算能力还有待确定,但有证据表明,视觉皮层的参与跟言语记忆任务中的行为表现有关。此外,先天失明个体的视觉皮层对句子有句法运动的反应(即激活),但对数学方程中的困难没有反应。这一结果支持了该区域有助于句子层级的句法结构计算的假设。总的来说,这些发现表明,有关认知功能规范的细胞结构约束留有一定程度的自由。
如果某个特定大脑区域的输入模式发生变化,这个区域可能会被用于非常不同的功能。基于这些类似的发现,Bedny得出结论,人类的皮质具有认知多能性,也就是说,能够承担广泛的认知功能。脑功能的专门化是由发展期间的输入驱动的,而这又受到连接性和经验的限制。语言的基本构件与基本运算之间的映射关系,与人类大脑的神经结构之间的映射关系,至今仍未被完全理解。语言的神经生物学基础结构的个体差异程度在很大程度上仍然是未知的领域。
即时性原则
现在,我们对语言处理动力学的关键特征有了更清晰的描述,部分原因是神经生理学测量的高时间分辨率。语言处理以惊人的速度进行。我们很容易每秒产生和理解2到5个单词。对速度的需求的结果是,在生产和理解中,语言构件的提取和组合操作都是递增的。
此外,语言处理的特点是直接性原则。在理解中,语言和额外的语言信息一经获得就被立即使用。也就是说,关于语境和环境的知识、来自其他模式的伴随信息(比如说话姿势),以及关于说话者的知识,都被立即带到同一个快速反应的大脑系统中,该系统结合了单个单词的含义。换句话说,大脑毫不拖延地利用所有现有的有关资料来共同确定说话者的信息。左额下皮层区域在与颞顶叶区域的动态交互中起着重要的作用,它统一了决定话语解释的不同来源的信息。
虽然没有确凿的证据表明预测对理解是必要的,但有一点是十分明确的,即预测有助于语言处理,而且可能与满足对速度的要求有关。很可能,词汇、语义和句法线索共同预测下一个预期单词的特征,包括它的句法和语义构成。语境预测与自下而上的分析结果不匹配,会导致大脑立即做出反应,为弥补即时解释过程而增加额外的处理资源。
信息结构
语言处理的速度也得益于这样一个事实:话语通常是说话者和听者之间较长时间互动的一部分。在这样的交互中,会话伙伴之间已经共享了一些信息。这通常被称为主题。新信息是添加的内容,因此是消息的关键组件。这通常被称为注释。信息结构是指主题和评论在句子组织中被包装的方式。演讲者经常注意标记包含新信息的焦点成分。不同语言之间的实现方式不同,因此信息结构不存在语言上的普遍性。
在一些语言中,语法位置用于标记焦点成分;其他语言则可能使用焦点标记韵律特征,如短语和重音。例如,在英语问答对中,答案中的新信息或相关信息通常带有音高重音。在诸如“玛丽在市场上买了什么?”答案可能是玛丽买了蔬菜(用大写字母强调)。在这种情况下,蔬菜是焦点成分,提供新的信息。
在功能磁共振成像和神经电生理学相关资料中发现:信息结构调节语言相关的激活。例如,如果连续的语言中包含了预期外的字和不合理的语法,且他们是焦点组成的一部分,那么它们分别会引起相当大的N400和P600效果。然而,如果他们是非焦点成分的一部分,这些效应会强烈减弱甚至消失(如图3)。被标记音调重音的新信息大体上激活了注意网络。这一现象可能是,为了调节语言处理的深度,在表达中标记相关信息的语言特征(如音调重音),会触发注意网络的运作。
这种解释与这样一种观点是一致的,即对听者来说,语言输入的全面重构在许多情况下是无法实现的,但就大多数目的而言,一个表面的和不完整的分析就足够充分了,即一些语义和语法细节可能会被忽略。最近,Ferreira和Lowder在预测、信息结构和充分的语言处理之间建立了联系。他们认为,对主题信息的处理已经充足了,而听者的预测工作则专注于新的或有重点的信息(评论),因为“理解和解释所需要的只是评论其识别——而主题已经存在了”
图3 语义上非预期的字引起的N400效应的地形分布
(A)非预期的字在焦点成分中。(B)相同的字在非焦点成分中。
语用推理
虽然在外脑皮层的区域,尤其是左半球,对命题内容的编码和解码很重要,但这并不是语言加工的全部。话语的意义往往强烈地依赖于语境信息,而这些信息实际上并没有被编入话语中。词汇和语言结构中的编码决定了什么是意义或意图。提取意图的意义需要基于对相互作用的主体意识和意图进行假设,以及对适当的语言使用拥有共同的理解。例如,在正确的语境中,“这里很热”不仅会被理解为一种对事态的陈述,而且还会是一种隐含的要求(如打开窗户或关小暖气)。语言的社会约束力和交际作用在很大程度上取决于作出正确的语用推断的能力。
到目前为止,相对较少的研究调查了有效沟通的神经基础,这部分超越了词汇检索、句子语法和语义的核心语言机制。然而,它们在语言使用中出现的情况是相当一致的。在心智理论网络(ToM,the theory of mind (ToM) network,即一个处理心智活动的大脑网络)中,语用推理依赖于核心区域的贡献。这些区域包括右颞顶叶交界处和内侧前额叶皮层,这些区域通常涉及需要精神状态推理的任务,即思考他人的意识、情感和欲望。
在一项研究中,作者让被试在图片前看句子。一种情况是,句子与图片的结合可以被解释为一种间接的行动请求。如把“这里很热”和一张门的图片结合起来。被试将此解释为要求开门。然而,同样的话语与沙漠的图片则被解释为一个普通的陈述句。间接请求条件下的句子比不可能将其解释为间接请求的句子更强烈地激活了心智理论网络。由话语及其语境所诱导的言语行为的识别,似乎需要心智理论网络中实例化的心智机制。
多网络视角
一种研究语言神经生物学的方法是从识别语言的本质开始。一旦语言的少数核心特征在动物中得以确立,那么人类大脑组织的哪些方面能够体现语言的本质,这个问题就可以解决了。这里所描述的叙述采取了一种不同的、非本质的立场。它是基于这样一种意识,即对人类语言技能的全面了解,并不能从言语和语言的本质和非本质方面加以区分(在语言学中,对言语和语言的区分是普通语言学这一科学学科诞生的标志之一,因此,在语言研究中,对言语和语言的区分是极为重要的)。
在第一步中,作者们需要将复杂的语言技能(如说和听)分解为基本语言要素和基本语言操作,作为编码和解码命题内容的关键构件。这些主要是由颞叶皮层和顶叶皮层的左额下皮层区域和其他一些部分支持,侧重于大脑左半球。需要通过与注意控制相关的多需求系统的交互来上调标记从而进入注释或新信息的话语成分的处理。此外,还需要将话语内容整合到跨多个连接话语的情境模型中。这个过程似乎涉及到右额下回和右角回。最后,为了从语言话语所提供的编码意义中提取出所要表达的信息,听者需要整合语言信息和非语言信息,并得出必要的语用推论,这需要那些对心智化至关重要的大脑区域作出的贡献。
总结:
总体来看,作者认为除了从记忆中检索词汇信息的核心区域和在产生和理解多词话语时词汇构建模块的统一之外,还需要其他的大脑网络来充分实现语言驱动的相互作用。多个大脑网络的贡献不是特定于语言的,而是与其他认知功能共享的。基本语言要素几乎肯定是特定于领域的,但基本语言操作的一些关键方面(如统一)很可能与其他领域共享,如音乐和算术。与经典模型相比,一个更复杂的相互作用的大脑区域的网络正在重新构建我们对语言处理的神经机制的理解。其主要原因在于,理解语言不仅仅是单子的处理,还有很多信息是超出了声学或正字法符号所给出的进入初级感觉皮质的信息。这种多网络的观点并没有消除对涉及语言基本要素的特定处理区域的深入研究的必要性,而是进一步强调了语言处理的复杂性和语言系统与其他系统的交互性。
原文:
Hagoort, P. (2019). The
neurobiology of language beyond single-word processing. Science, 366(6461),
55–58.
doi:10.1126/science.aax0289
微信扫码或者长按选择识别关注思影
第十四届磁共振脑网络数据处理班(重庆,7.26-31)
第三十届磁共振脑影像基础班(南京,7.31-8.5)
第十届脑影像机器学习班(南京,6.30-7.5)
第十二届磁共振弥散张量成像数据处理班(南京,6.18-23)
第二十届脑电数据处理中级班(重庆,8.9-14)