视觉大脑与语言大脑
在人类探索视觉皮质的短暂历史中,米切尔·格利克斯坦教授(Mitchell Glickstein)重点介绍了一批从不同角度研究视觉如何在大脑中进行运作的医生。弗朗切斯科·真纳里(Francesco Gennari)是一名18世纪在意大利帕尔马求学的医学生。他将大脑置于冰上进行解剖研究,由此“开创了脑结构学这一新领域,即研究大脑皮质结构中的区域差异”。苏格兰神经学家戴维·费里尔(David Ferrier)在寻找控制视觉的大脑区域时无意间发现了视觉引导的运动或运动机能。俄国研发出不会击爆士兵头骨的步枪之后,日本医生井上达二(Tatsuji Inouye)得以记录下子弹进出大脑的位置点,并计算出29名在1904—1905年日俄战争期间受伤的日本士兵大脑中视力受损的位置。几乎是在同一时期,英国的神经学家通过研究英国的受伤士兵得出了一张更易于理解的图表。
大脑中与语言关系最为密切的两个区域是以19世纪两位神经学家的名字命名的。他们分别发现了在大脑中发挥着独特作用的两个区域。一位是法国外科医生保罗·布罗卡(Paul Broca)。布罗卡在治疗一位失去语言功能(失语症)的患者的过程中确定了大脑中语言中枢的位置,病人的大脑左侧额叶存在病变损伤。这一发现在随后的尸检中得到了证实。这个大脑皮质的特定区域因而被命名为“布罗卡区”。布罗卡区受伤的人通常能够完全理解语言却无法表达。另一位是波兰神经外科医生卡尔·韦尼克(Carl Wernicke)。韦尼克在布罗卡研究工作的影响下也发现了类似的病变损伤,但是这一次它出现在颞叶后部。布罗卡区不仅与语言的生成即遣词造句紧密相关,而且负责我们对诸如手势、面部表情和肢体语言等非语言类表达的理解。布罗卡区靠近大脑指挥口部动作的运动皮质,而主导理解语言的韦尼克区靠近听觉皮质。一个韦尼克区受损的人通常在理解上杂乱无章,因此即使能够开口说话也说不明白。这些区域之间由一个不包含任何信息却能够将一个人的语言表达与思考理解融合为思想的关联束连接起来。人类的关联束远大于其他动物的关联束。这一点恰好有助于解释为什么人类具有复杂的语言表达及沟通体系。
人们还通过具有高度侵入性的实验,例如将电极连接到人或动物的大脑的不同区域来准确认知大脑的运作过程。在其中一项实验中,人们发现刺激大脑的一侧会引发身体另一侧的活动。两位德国生理学家古斯塔夫·弗里奇(Gustav Fritsch)和爱德华·希齐希(Eduard Hitzig)在治疗头部受伤的士兵时,通过用电流刺激他们的后脑勺来探查究竟大脑的哪一部分会产生自主运动。他们之后在一条狗的身上重复了这项实验。发现了运动机能的神经学家戴维·费里尔在移除猴子的前额叶后,发现它们虽然运动技能未受影响,但是性情大变。(根据英国1876年出台的《禁止残酷对待动物法》,费里尔也成了第一位受审的科学家。)
奥利弗·萨克斯指出,大多数对大脑的研究源于大脑功能的不足或缺乏。有某种特定缺陷的病人让科学家有了一探究竟的机会,而这种探究反过来让人们得以了解大脑的功能。人类对大脑探究最著名的早期案例也许来自一位名叫菲尼亚斯·盖奇(Phineas Gage)的铁路工人。他不幸被一根金属长棍从脸颊处刺入,贯穿而上,从头顶上方穿出。尽管他奇迹般地活了下来,能看,能走,能说话,但是自此性情大变,满嘴脏话,举止粗鲁。这或许就是人们了解大脑前额叶皮质功能的第一扇窗口。2012年,也即盖奇的案例出现160多年之后,加利福尼亚大学洛杉矶分校神经成像实验室的研究人员将高科技工具与110张盖奇的虚拟头骨图像相结合,仍在努力挖掘导致盖奇行为及情感功能丧失的背后原因,并试图阐明它对脑损伤和退行性疾病(如痴呆)的影响。
随着时间的推移,研究人员已能够借助开发成功的工具在没有侵入性手术的条件下观察大脑内部。脑电图扫描(EEGs)、计算机轴向断层扫描(CAT scans)和磁共振成像扫描(MRIs)已经取代了正电子发射断层成像(PET)的扫描技术。它们能够生成高度精准的大脑图像以用于诊断脑损伤、脑肿瘤、痴呆、中风等。显示大脑活动的功能性磁共振成像(fMRI)又让扫描技术往前迈了一步。
尽管如此,功能性磁共振成像仍有其局限性。我认为这项技术就如同一架飞机在一大片使用同一台发电机的房子上空进行夜间巡逻。如果安装有发电机的那栋房子被闪电击中,那么一整片房屋都会陷入黑暗之中;如果安装有发电机的那栋房子没有被闪电击中,那么其他的房子依然会灯火通明。也就是说,当我们依赖功能性磁共振成像技术时,我们将不可能知道“发电机”的准确位置,除非我们用电极击中它。因此我们也无法确定究竟哪一个神经网络节点会开启整个系统。
需要重点明确的是,人类对视觉的依赖程度远高于对其他感官的依赖程度。研究表明,我们看到某物以及我们想象自己看到某物都会激活大脑枕叶(视觉皮质)和颞叶的大片区域。这两个区域加起来约占大脑的1/3,具备大量的功能。所有哺乳动物的初级视觉皮质都位于距离眼睛最远的后脑。我们至今仍不清楚它的位置为何如此靠后,或许这个位置有助于深度知觉的进化发展。
信息数据基本上存储在大脑的三个位置。我觉得可以将之类比成你的手机、手机桌面和云盘来存档详细的视觉记忆。视觉信息通过眼睛进入大脑,并存储在后脑的视觉皮质及其他一些相关结构中,其中包括一个梦境热区。想象你正在使用自己的手机拍摄照片或视频。你是想将它们存储在你的桌面(中脑)并按类别进行归档(狗、家庭、树木、视频等),还是需要将它们上传到云盘妥善保管呢?额叶皮质会将所有的信息数据分门别类。这个过程与你决定如何整理自己的照片(选择拖放至桌面还是上传到云盘储存)是一样的。额叶皮质自身并不储存任何东西,但你会在那里安排自己的生活。这个过程被称为发挥执行功能。那么,信息在大脑中究竟是如何传送的呢?让我们再次进行类比,它的传送路径犹如高速互联网、无线局域网或者拨号上网。
我多年来参与了不少的脑部扫描研究,每一次使用的都是最新的技术。作为一名科学家,我对探索自己大脑的未知领域一直怀有强烈的冲动,也一直试图破解有关孤独症的一些谜团或更好地理解我到底是如何思考的。1987年,加利福尼亚大学圣迭戈分校医学院的埃里克·库尔谢纳(Eric Courchesne)用当时最先进的磁共振成像扫描仪第一次扫描了我的脑部。这项当年的尖端技术能够对大脑结构进行精美、清晰的细节测量。当我看到那些图像时,我连连惊呼道:“哇哦,这是一次去往我大脑中心的旅程!”它让我理解了为什么我有平衡问题,因为我的小脑竟然比人类的平均值小了20%。另一次磁共振成像扫描则解释了为什么我在服用抗抑郁药物前焦虑水平会那么高,因为我的杏仁核(情绪中心)是平均值的三倍。
匹兹堡大学的沃尔特·施奈德(Walter Schneider)给我做的脑部扫描结果最是令我大开眼界。施奈德是弥散张量成像(DTI)这一新技术的发明人。这项技术能够对在大脑不同区域间传递信息的神经纤维束扫描成像。施奈德的研究由美国国防部资助,目的在于开发出一种可以用于诊断士兵头部受伤情况的高清纤维束追踪(HDFT)成像。比起当时的其他设备,这项技术不仅成像更清晰,还能区分出神经纤维是在何处互相连接的,又是在何处互相交叉的。我的言语表达回路要比对照组的小很多,这也许能够解释为什么我从小语迟。但是,我的视觉成像结果异军突起,比对照组的数值高出了400%。这就好比我的大脑里有一条巨大的干线将后脑的视觉皮质与前额叶皮质联通了起来。这说明我是视觉思维者。
正是这些传输信息的线路使得大脑运行顺利通畅,或导致发育问题。举例来说,尽管你的眼睛动来动去,但是你在阅读时页面上的文字并不会跳来跳去。这就要归功于你大脑中的稳定线路。它可以阻止页面上文字的抖动跳跃。线路不畅则会导致视觉成像失真或带宽问题,以及口吃、阅读障碍和学习障碍。
需要再次强调的是,视觉思维并不是观看这个动作本身。换句话说,每个人,只要不是盲人,每天都在观看。视觉思维指的是大脑的工作方式,即我们感知世界的方式。尽管我们对大脑已经进行了各种探究,但是迄今为止我们没有得到关于视觉文件是如何被创建、存储以及提取的完整信息。我们知道虽然视觉感知与心理意象使用的是大致相同的大脑结构,但它们是截然不同的神经现象。简而言之,我们理解生理硬件的工作方式,却对生理软件的运行方式所知不多。
马里兰州贝塞斯达国家心理健康研究所的神经科学家李秀贤(Sue-Hyun Lee)及其同事能够区分出一个人在观看某个物品时与在想象自己观看某个物品时大脑不同的运作方式。这一区分让人类对大脑的认知又往前迈了一步。当受试者被要求观看普通物品的图片时,功能性磁共振成像扫描会捕捉到信息流通过眼睛流入初级视觉皮质的输入点,进而向前移动到进行信息处理和存储的中脑区域。当受试者被要求想象自己在观看同样的普通物品时,中脑区域会立刻被激活。也就是说,两种信息流在大脑回路中的流经方式是不一样的。
在较早的一项研究中,一名30多岁的男子因头部受伤而无法正常识别普通物品。当有人递给他一杯咖啡时,因为他在桌上的一众物品中无法识别出咖啡杯,所以他无法喝到咖啡。当他去吃自助餐时,他也无法识别琳琅满目的食物。在他看来,食物是一个个颜色鲜艳的色块。当他对普通物品进行识别时,他错将一把钳子当作一个晾衣夹。但是,他能够在想象中“看到”普通物品。扫描结果显示他的大脑中负责处理视觉信息的枕颞区可能受到了损伤。类似的研究开始逐步揭示出我们的“想象之眼”实际上依赖的是与视觉皮质并不相同的另一个信息处理器。
在更早的关于我们如何思考的神经学研究中,开创性的研究集中在视觉思维者身上。在1983年发表的一篇颇具影响力的论文中,神经心理学家莫蒂默·米什金(Mortimer Mishkin)描述了猴子大脑中两条独立的皮质处理路径,一条用于识别物品,另一条用于定位物品。2015年,西村和夫(Kazuo Nishimura)及其同事开展了一项与语言思维和视觉思维相关的大脑活动的研究。他们让参与研究的受试者依次回忆日本的一座著名寺庙、十二星座的对应符号和一段个人的谈话。在整个过程中,研究人员对受试者的神经活动进行同步测量。他们发现,“一个人主观视觉想象的‘生动性’与其大脑视觉区域的活跃性紧密相关”。脑磁图(MEG)显示视觉思维者会在执行任务的过程中生成图像,而语言思维者则更多地依赖自说自话。这项技术可以测量被激活的大脑区域的快速变化。
其他的研究似乎将视觉思维和语言思维这两种不同的思维方式与大脑的左右半球联系了起来。2019年,来自中国重庆的西南大学、研究创造性的认知神经机制的陈群林教授与一位同事一起给502名受试者分配了4项任务:让一只玩具象变得更好玩、画出10个图形、想出一个罐子的其他用途、观看模糊的图像并列出从中得到的想法。在整个实验过程中,他们对受试者的大脑进行了磁共振成像扫描。脑部成像显示,那些能够轻松完成任务的视觉思维者的大脑右侧的活动更集中,而那些难以完成任务的语言思维者的大脑左侧的活动更集中。这些发现后来推动了日趋流行的右脑思维与左脑思维的说法。右脑与创造力相关,而左脑与语言和组织能力相关。美国神经心理学家和神经生物学家罗杰·斯佩里(Roger Sperry)因其对裂脑人的研究而获得了诺贝尔生理学或医学奖。他认识到人们对左脑思维的偏向,同时承认我们总是倾向于“忽视非语言类表达的智力模式,其结果便是在现代社会中普遍存在的对右脑思维的歧视”。
随着科学研究开始验证视觉思维的存在,我也开始意识到将视觉结构与语言结构二元分离的方法过于简单了。视觉思维与语言思维并非非此即彼、二元对立的关系,相反,它只是在描述我们每个人都落在其中的谱系的端点位置,一些人比起另一些人更靠近谱系的这一端而非另一端。事实上,陈群林的研究突出了大脑区域间的“半球平衡”对语言思维的关键作用。在不同类型的思维模式间清晰划定界限并不容易,不论是针对大脑本身还是针对不同大脑所擅长的技能。你可能是一个擅长数学的语言思维者,也可能是一个爱写诗的火箭科学家。
脑科学中的遗传学研究则更为复杂。一些研究者假设让脑容量变大的基因与导致孤独症的基因相关,这暗示着基因组的取舍:高智商的代价就是一些社交和情感能力的缺失。近来的基因测序研究表明,的确有很多基因都与孤独症有关。北卡罗来纳州的儿童精神病学家卡米洛·托马斯·瓜尔蒂耶里(Camillo Thomas Gualtieri)博士将这些基因称为“微效基因”。这或许可以解释为什么孤独症的症状范围会如此之大,从有某些轻微特征到严重的人身残疾。人类基因构成的复杂性让人类具备了广泛的环境适应能力。然而,人类为之付出的代价就是少数人会有严重的残障问题。
我们可以在天生失明者身上观察到类似的基因组取舍现象。所有珍贵的大脑区域都会被重新用于执行其他功能。约翰斯·霍普金斯大学的拉什·潘特(Rashi Pant)及其同事的一项研究发现,先天失明者会使用部分的视觉皮质来回应数学方程式、简单的是非题以及语义判断,而后天失明者则不会。这一研究表明视觉系统和语言系统之间存在沟通渠道。
我发现能够描述视觉思维如何运作的最佳例证之一,就是一些盲人通过回声定位系统学习导航的过程。蝙蝠是回声定位的高手。它们会发出高频的尖锐叫声,继而通过周围传来的回声来探测飞行途中的猎物和其他障碍物。回声定位得以让蝙蝠通过声音“看”到物体。大约25%的盲人学会了通过嘴部发出碰击音、打响指或敲击手杖的方式进行回声定位,而后运用自己的听觉皮质和改变了用途的视觉皮质来“看”到周围的物体。娴熟的回声定位者能够探测出大型物品的形状、运动轨迹和位置。大脑似乎可以适应使用声音这一非视觉信息来执行视觉感知任务。对非常年轻的人来说,大脑在改变用途方面体现出了极大的灵活性。另一项有意思的研究表明,当先天失明者进行代数运算时,他们的大脑会使用早期从未通过眼睛接收过信息的视觉皮质。这一点在视力正常者的身上不会出现。换句话说,大脑一开始有相当大的一部分专门用于视觉思维,但是如果未获使用,其他功能将取而代之。大脑是不会让具有价值的功能区域闲置不用的。这项研究还表明大脑是为创造图像而设计的。当我们的眼睛停止提供信息时,我们的大脑就会学习运用其他感官来创建图像。
其中一个极端的例子就是马修·惠特克(Matthew Whita-ker)。我第一次看到他是在电视新闻节目《60分钟》上。在第24周便早产出生的马修原本预计无法存活。然而,他顽强地活了下来,但因一种被称为伴随性视网膜病变的疾病而双目失明。在他3岁那年,祖父送给他一架小小的电子琴。马修很快便能上手弹奏,并能轻松唱出自己听过的歌曲,譬如《一闪一闪小星星》。5岁那年,马修成为纽约市菲络缅·M.达戈斯蒂诺·格林伯格视障者音乐学校历史上年龄最小的学生。他的老师在报告中指出,在聆听音乐会上她参与演奏的德沃夏克钢琴五重奏之后,第二天早上,马修不仅能演奏出曲目的钢琴声部,还能演奏出其余4个弦乐声部。马修的足迹如今遍布全球,他专业演奏爵士乐。
研究艺术家与音乐家神经网络的查尔斯·利姆(Charles Limb)博士分别在马修弹奏钢琴、聆听喜欢的音乐和聆听一场沉闷的演讲时,对他的脑部进行了扫描。当马修聆听演讲时,他的视觉皮质毫无反应,而当他聆听自己喜欢的音乐时,他的整个视觉皮质便开始活跃。利姆发现:“就好像他的大脑正在利用从未被视觉刺激过的那部分组织,或者说用那部分组织来帮助他感知音乐。”
过去几年间,至少有12项新的脑部扫描研究将重点放在了视觉思维及其如何在大脑的不同区域被激活上。新一代扫描仪能够更快速、更准确地检测到被激活的大脑区域。话虽如此,由于检测方法的不准确或不完整导致重复实验变得困难,新一代的磁共振成像依然会产生偏差性结果。在我自己的研究领域,我也看到了一些重要的细节在研究方法部分是被遗漏的,譬如如何选择受试者、如何挑选猪的品种或饲料的成分。就像在倾斜的滑槽中能看到斜射的阳光一样,那些令人不安的细节会突然出现在我的脑海中。磁共振成像研究中出现的自相矛盾的结果也许就是由一些看上去微不足道的细节决定的,例如受试者得到提示的时机或被持续观测的时间。此外,这种矛盾性也可能来自我们在研究工作中已经看到的确认偏差,即大多数视觉测试是由心理学家设计进行的,而他们大多是语言思维者。当研究结果取决于究竟是谁在分析实验的时候,结果自然会出现矛盾或偏差。一如我们将要探索的,空间可视化者与对象可视化者在以不同的方式看待这个世界。