首页
我们
党建
科研
学人
资源
教学
搜索

特别策划 | 石锋:王士元之问——AI与人类习得语言的方式如何不同

作者:石锋 来源:今日语言学 时间: 2025-01-23
字号:

  1.辛顿和乔姆斯基之争背景下的王士元之问

  著名语言学家王士元先生(Wang 2024)在第十五届演化语言学国际会议致辞中说道:

  “人类之所以演化成为‘地球主宰’,很大程度上是因为我们发明了语言,这是一种能够跨越时间和空间、汇集和整合知识的心理技术。随着科学革命的显著进步,人类现在是一个超级有机体,连接着70多亿个头脑,这些脑海里的思想都经由电磁的方法通过互联网连接在一起。”

  “最近几十年来,最显著和令人惊讶的进步出现了,因为机器成功地入侵了人类语言,现在可以取得数千年人类文明积累的所有知识。电子可以用数倍于生物大脑的速度更快、更精确地处理信息和再现信息。在棋盘游戏中轻松击败人类,这只是更强大的智能机器正在发展的一个小小的预兆。再举个更引人注目的例子,这种新智能的主要好处是可以解决生物学中棘手的蛋白质折叠问题。”

  “面对演化过程中的这些根本变化,人类作为地球主宰的时间还能持续多久,这一问题现在正在激烈争论之中。抛开这些宇宙问题不谈,语言学家们面临着新的、令人兴奋的问题。大语言模型(LLM)习得语言的方式与人类习得语言的方式有什么不同?相对于语言在大脑中的表征方式,语言在LLM中是如何表征的,即所谓的‘模型-大脑对齐问题’?如果能够找到一定程度的对齐,这些知识能否用于更好地理解语言和认知障碍的性质,并制定干预措施?”

  我们把以上致辞中关于大型语言模型的三个问题,称为王士元之问。其中的背景当然要讲到“AI教父”杰弗里·辛顿(Geoffrey Hinton),他于2024年4月获得都柏林大学学院颁发的尤利西斯奖章,在致谢演讲中批评道:“语言学家被一个叫乔姆斯基的人误导了好几代。”而且2024年10月辛顿获得诺贝尔物理学奖之际,还不忘批评乔姆斯基。这使人不禁联想到美国国家科学院院士查尔斯·霍科特(Charles Hockett)就曾经预言,乔姆斯基的道路“不是突破(breakthrough),而是崩溃(breakdown)”。然而,乔姆斯基毕竟是“主流语言学”的代表人物之一,批评他,也就是挑战“主流语言学”。很多人还身陷赞成和反对的议论辩驳中时,王士元之问却抛开辛顿和乔姆斯基之争,独辟蹊径,直指问题的核心。

  笔者的能力所限,远远不能圆满地回答王士元之问。本文只是从语言学基本观念上,为解答王士元之问尽力做一些准备工作。我曾写过“音义结合是任意的吗?——重读雅可布森评索绪尔之一”(2013)、“语言之谜:来自人工智能的挑战”(2023)、“大语言模型在哪里挑战了语言学?”(2024)等文章。已经讲过的观点,这里就简略提到,以前没讲过的观点,这里就多说几句。

 

2.语言是概率系统还是规则系统

  “真的语言是大半有规则,小半不规则的一个系统。”(赵元任 2002 [1965]:590)我们已经估测出有规则的大半约为70%,不规则的小半约为30%。(石锋 2024)所以当年走规则之路的机器翻译的正确率,最多也就达到70%左右。走概率之路的研究长期受到冷落,并不是路子不对,而是数据、算力、算法的条件还不具备。如今这三条齐备,人工智能就有了革命性的突破,用李飞飞的话就是“寒武纪大爆发”。这就在事实上证明了,语言是概率系统这一结论优于语言是规则系统的结论。

  然而,概率系统和规则系统之间并不是相互截然分开、彼此孤立隔离的。按照赵元任的连续性方法论,从概率系统到规则系统可以形成一个连续统。所谓不规则,就是出现的概率小;所谓规则,就是出现的概率大。过去有“例不十,法不立”的说法,应该就是考虑到概率了。不过只有十例,在浩瀚的语言大海中还是显得太少了。赵元任的“言有易,言无难”好像更能说明语言的这种概率性本质。我们可以从中得出一条语言优选法则:语言中的所有成分都是依据概率优选的结果,只是优选的条件依据具体语言的具体情况而有所不同。这应该才是普遍适用的。(石锋 2023)我曾在多年前讲过,语言中唯一没有例外的规则就是,语言中所有的规则都有例外。至今还没有哪位学人对此提出异议。

  辛顿倡导基于神经网络的连接主义(connectionism),这跟语言的概率有什么关系呢?概率计算有各种方式,对于人工智能的预测选择最重要的就是共现概率:不仅计算两个词语邻接共现的概率,也可以计算远距离共现的概率;不只是从左到右的排列共现,还可以是从右到左的排列共现;不仅是词语之间的共现概率,还可以是句子之间的共现概率。从这里,我们可以想到,维特根斯坦讲的“意义即用法”,还有赵元任说的“是语境提供了条件才使比较具有意义。”这也就是意义在语境(上下文)中得到确定。语义是语言的灵魂。语言研究要把语义的表达作为中心。语义在哪里?语义在用法中,语义在语境中,语义在共现概率中。这就是我们特别需要建立的基于数据和概率统计的科学方法论。

  其实很多有学术敏感的语言学者早就有意或无意地在不同程度上发现了语言的概率性质,并进行研究。只是大多被学界忽略,或者被视为非主流、非本体,而被排除在主流和本体之外。(石锋 2024)所以对于所谓主流,要有一种清醒的认识:当一种理论、一种观念、一种看法成为主流(或者自封主流)的那一刻,它就变成了阻碍青年学子(当然也包括为数不多的中老年学人)创新前进道路上的绊脚石,甚至是拦路虎。直到新的理论、新的观念、新的看法在主流的高压下不断积蓄力量,达到相当的程度,进而推翻旧的主流,成为新的主流。新的主流又会经历同样的过程。学术就是这样发展的,历史就是这样螺旋式演进的。

 

3.人类的认知就是一种循环

  语言是一个整体,把语言划分为语音、语法、语义、语用等不同的部分,是人类的主观行为。要清醒地看到,这种做法有利有弊。在具体的研究中,应该以问题为导向,而不是以学科为导向。这些不同的部分应该是有分有合,而不是只分不合。例如,焦点问题既是语义的也是语法的,实际上还离不开语音和语用。有一种强调焦点句,只有语音上的突显,语法学家有什么办法吗?(石锋、夏全胜 2022)所以我们才有语音必选原理,即焦点的表现有词汇、句法、修辞、语用、语音等各种方式,其中只有语音是必选的,其他都是可选的,并且所有其他的方式都是通过语音形式表达出来的。(石锋 2019)我们提倡的大语言学就是向外融合文、理、医、工等多学科,向内跨越语音、语法、语义、语用等多层面。这属于追求概率性的、非确定论的、演化论的科学观。

  语言就是一种复杂适应系统,具有显著的连续性。赵元任在100多年前写出的博士论文《连续性:方法论的研究》,早就为我们提供了先进的理论和方法。现在是应该认真学起来、用起来了。特别是,当年赵元任强调说,他的博士论文就是用连续性方法去研究连续性方法论,“正是本文研究的方法本身被用来作为研究它们的方法,试图表明循环并不总是恶性的”。(赵元任 2023:1)他风趣地说:“这样说来就像是在原地兜圈子,或者像是要用自己的鞋带把自己拉起来。但是……有些圈子绕起来并不是无意义的,而有些用鞋带提拉自己的努力也不是徒劳的。”(同上:5)

  我们现在利用模仿人类大脑的人工智能作为对照,来激活我们的大脑,探索研究我们的大脑,从而进一步认识理解我们人类大脑的智力,这应该也算是在兜一个圈子吧。联系到赵元任后来曾引证韩礼德的“相互定义”说,并指出:“顺便讲一句,没有任何内在因素反对这样一种循环定义,因为不仅仅是数学,而且所有科学理论都是在一个大圈圈内定义的,只要这个大圈圈很大就行。”(赵元任 2002 [1970])实际上,人类的认知就是一种广义的主客观之间的循环,是大自然的自我反馈。这就如同自己抓着自己的头发要离开地球一样。

  史有为老师说:“我投身语言学以来,一直在赵元任的影响下,从方言到语言教学,到语法研究,处处都有他的影响。”[1] 这话说得好。中国语言学人都是在赵元任的影响下成长起来的。如果我们能够认真读赵元任,学习领悟他的学术思想,就可以更好地把人工智能的挑战转变为机遇,可能就会避免跟着别人去重复他们走过的弯路。

  人类能够了解以纳米计算的基本粒子,能够观察以光年估测的宇宙星球。可是对于人类自身的大脑,却只是刚刚拉开黑箱幕布的一角。在这里一分一毫的进展,都是人类知识的尖端前沿。工欲善其事,必先利其器。有了人工智能这样的前沿利器,就给了我们一个绝好的机会,深入地探索人类的大脑黑箱,更新我们对于自己的认知机制和大脑智能的认识和理解。利用人工智能来进一步认识人类的智能,这也是一种善意的循环。

 

4.人类的智能并不是铁板一块[2]

  辛顿讲到,人工智能将比人类更加聪明,“它们以为自己可以做一些更加明智的事情”[3]。他好像是把人类的智能看作一个整体来说的。实际上,人类的智能并不是铁板一块,而是可以划分为不同的成分或是不同的层级。在这方面,已经有少数先驱的学者从不同的视角做出了各自的贡献。

  美国伊利诺伊大学实验心理学家雷蒙德·卡特尔(Cattell 1941,1963; Horn和Cattell 1967)基于一系列心理实验和测试,把人类智力分为液态智力(fluid intelligence)和结晶智力(crystallized intelligence)两种因素。液态智力以先天赋予占主导,表现为神经生理和偶发性影响的模式,比如空间认知、音乐才能等;结晶智力以后天学习为主导,表明了文化适应融合的程度,比如语言习得、生涯选择等,它是人类能力的决定性因素。液态智力和结晶智力两种因素作为智力检测的指标,它们的表现是相互关联的,并且是随着年龄增长而动态变化的。年轻人液态智力的平均水平总体上高于老年人。随着脑部损伤和身体衰老,液态智力会下降。老年人结晶智力的平均水平系统地高于年轻人。

  美国耶鲁大学心理学家罗伯特·斯滕伯格(Robert Sternberg,1985-1988)提出智力三元理论(triarchic theory of intelligence)。他按照认知心理学的理念,认为人类智力是相互连接的三种智力的统合体。这三种智力分别为:成分智力(componential intelligence)、经验智力(experiential intelligence)和情境智力(contextual intelligence)。

  成分智力即智力内部的心理机制,包括三种成分及相应的过程:一是元成分,用来确定问题的性质、选择解决策略等;二是运作成分,指实际运作过程中的信息存取和工作记忆;三是知识获取成分,指接收、筛选、获取和存储新信息的过程。

  经验智力涉及与智力密切相关的个体经验,包括两种能力:一是?处理新任务和新环境的能力,具有创新性和灵活性;二是自主加工整合?信息的能力,能有效地完成任务。

  情境智力关注智力的外部作用,表现为积极地适应环境、选择新环境和改变环境的能力。这也就是获得与情境拟合的心理活动。

  传统智力测验所测的智商只是智力三元论中的成分智力。斯滕伯格扩展了传统智力理论中的智力概念,有助于我们更全面地考察人类个体的智力状况。

  在这方面最为著名的是美国哈佛大学心理学家霍华德·加德纳(Howard Gardener)于20世纪80年代提出的多元智力理论。他认为,人类智力结构中存在着七种相对独立的智力类型,共同构成了人类智力的多样性。

  1)语言智力:语言理解和语言表达,包括倾听、说话、阅读和书写的能力。作家、演说家和播音主持人是这类的典型。

  2)数学逻辑智力:运用数学运算、逻辑推理进行科学思考的能力。数学家和科学家是这类的典型。

  3)视觉空间智力:准确观察周围世界的形象和辨认目标方向的能力。画家、雕塑家和飞行员是这类的典型。

  4)音乐韵律智力:对声音和音乐的敏锐辨识和音乐韵律表达的能力。作曲家和歌唱家是这类的典型。

  5肢体运动智力:良好的肢体支配及身体、大脑间的协调运动能力。运动员、舞蹈家和手术医生是这类的典型。

  6)社交智力:在交往中观察、理解他人,并适当沟通、和谐相处的能力。

  7)内省智力:理解认识自身,并选择适宜的人生道路,对自己的人生负责的能力。

  Gardener(2011, 2020)把社交智力和内省智力合称为个性智能(personal intellectual),确实很有道理。这些智力类型在每个人身上的组合方式不同,每种智力都有其独具的特征。加德纳揭示出人类智力的多元性质,为我们提供了观察人类智力多彩表现的新视角。

 

5.自主智力和非自主智力

  我最近在考虑辛顿关于人工智能将会超过人类智能的预言时,就想到这样一个问题:人的智力可以分为自主智力和非自主智力。自主智力就是基于自我意识、生活常识的智力,即一般个人可以根据具体情况做出自主选择,或者凭借主观努力可以解决问题。例如,对一件事的是非曲直、正误善恶作出判断,这属于自主智力。自主智力具有较强的综合性与灵活性。人除了具有自主智力之外还有非自主智力。非自主智力就是个人的自主选择由于天赋条件的不同而受到一定的制约,也就是超出个人的自主选择范围。非自主智力具有技艺性和工具性。例如,数学天分就更多地属于非自主智力。

  卡特尔的液态智力和结晶智力的理论很有道理,也有实验证据。如果把加德纳的七种多元智力按照液态智力和结晶智力来划分,数学智力、空间智力、音乐智力、运动智力四种可以归为液态智力;语言智力、社交智力和内省智力可以归为结晶智力。如果把自主智力和非自主智力的区分也套用在这七种智力上,好像跟液态智力和结晶智力的划分有重叠的趋势。例如,可以把语言智力、数学智力、空间智力、音乐智力、运动智力五种归为非自主智力;把社交智力和内省智力归为自主智力。即,液态智力大体相对于非自主智力,结晶智力大体相对于自主智力。只有语言智力是例外,既是结晶智力,又是非自主智力。所以语言是需要特别关注的对象。

  这种划分可以说是有一定道理的,在强调自主智力和非自主智力之间的差异时。从功能角度来看,非自主智力的确更多表现为对外部刺激或工具的反应,侧重于技术性、感知性或执行性活动(如语言、数学、空间、音乐和运动)。这些智力更多依赖于个体对外界信息的处理和表现。而自主智力,就是社交智力和内省智力,涉及个体对自身和他人的理解、情感、决策和道德判断,这些都需要较高的自我意识和对他人情感与思想的洞察,确实可以看作更为主动和自主的能力。

  然而这样的分法也是有些主观,有些粗略的。比如语言智力和音乐智力,本身就包含了许多不同的能力,语言涵盖了语法、语义、语音等,音乐涵盖了音准、视谱、节奏感等,含有许多创造性的成分。同时语言智力、数学智力、空间智力、音乐智力、运动智力也不是完全天赋的,很多还需要后天的学习和开发,否则只能是某种潜在的能力。社交和内省也不完全是自主的,或许也有天赋的成分。所以自主和非自主应该作为一种相对的倾向性的程度差别;不是静态的,不是绝对的,而是具有动态的灵活性。

  卡特尔把液态智力和结晶智力作为人类智力的两种因素。同样,自主和非自主是从不同的视角得到的构成人类智能的两种相辅相成、互动互补的成分。每种智力里面都有自主和非自主的成分,如音乐智力中包括有自主智力和非自主智力的成分,只是非自主的成分多一点。二者不断地此消彼长、相互转化。所谓转化,就是经过个体的努力或放弃,使这些智力增强或减弱。

  我们先是讲清了思维可以离开语言,也就是思维和语言可分(石锋 2023)。后来又分出人类自然语言是带思维的语言,人工智能的语言是不带思维的语言(石锋 2024)。现在我们又可以把智力分出自主和非自主两种成分。这对于解释人工智能的原理和作用会有很大的便利。下一步的想法就是:人类的完整智力包括自主和非自主的两种成分,而人工智能只模仿到其中的部分非自主成分,并不是全部完整的人类智慧。这样解释是不是可以更合理些,更容易明白些?我感觉,但凡是人工智能出问题、出错误的地方,应该大多是属于自主智力的情况,例如信仰、道德、荣辱、正义以及是非曲直、正误善恶。

 

6.余论:个性和理解

  人工智能语言和人类语言的根本区别在哪里?最为重要的根本点在于AI没有个性。因为LLM数据库来自互联网,不可能把每一个提供语料的人都区分出来。所以,AI不懂得人际交往的远近亲疏。而人类社会网络中的每个人都是独特的“这一个”,人类语言是有个性的。这是AI语言和人类语言之间根本性的差别。(石锋 2023)我当时讲的时候只是凭借自己的一种直觉,但是还讲不出更多道理,所以并没有展开讨论。现在可以多讲些道理了。

  前面提到,Gardener(2011, 2020)把社交智力和内省智力合称为个性智力,确实很有道理。这样我们就能够明确讲出:所谓没有个性,就是缺失社交智力和内省智力。也就是不能够在交往中观察、理解他人,并适当沟通、达到和谐相处;也不能够理解认识自身,并选择适宜的人(机)生道路,对自己的人(机)生负责。关于AI没有个性,确实在AI产出的语言中也有所反映。现在已经有人采用核磁共振测试的方法,请被试分别阅读AI产生的语言文本和真人的语言文本,进行对比,确实在大脑中有不同的反应结果(Wei等 2023)。

  谈到人工智能理解语言的问题,我曾经跟袁毓林老师私下讨论过。我们的看法小有差别。人类的理解力应该是有强弱差别的。有的人深刻,有的人肤浅,至少有字面上的理解和深层意义的理解。这个理解力跟人生阅历、工作经验、认知能力(即个体悟性)等,都有关系。我们考虑把对语言的理解力分为三个层级比较合适:1)字面理解,就是上下文联系,属于“知”的层级;2)常识理解,就是联系自己的生活常识,属于“懂”的层级;3)深度理解,就是联系各方面的专业背景知识,属于“悟”的层级。说人工智能理解人的语言,应该是在表层的或是字面的理解,有可能达到部分的常识理解,但很难进入深度理解。

  蔡雅菁老师给我讲了一个深度理解的例子:回台湾前,她上网买了台湾一家公司的蛇年春联,其中一张非常妙,写的是“蛇美龙贺”。起初一看,她只觉得是在说龙年走了,恭贺蛇年到来。再细想,才发现,其实普通话这四字的谐音很像闽南方言的“啥物拢好”(即“什么都好”)。因此这个春联可同时用普通话和闽南方言来理解,意思截然不同,却都是吉祥话。我想人工智能就做不到这一点。我一直有一个想法:两个阿尔法零可以对弈,如果要使两个ChatGPT对话聊天,会是一种什么情景呢?

 

7.结语

  王士元先生希望“那些有勇气迎接挑战的年轻朋友”来讨论和回答他的问题。这也是给语言学界青年学子的一个机遇。今年的诺贝尔物理学奖和化学奖两项基础科学的大奖都颁发给了AI研究者,标志着AI时代的到来。为了适应这个有了人工智能的世界,我们一定要保持清醒的头脑和冷静的思考,更新科学观念,转换研究范式,学会在AI的帮助下进行语言教学和语言研究。新的理念、新的范式,天然地青睐充满活力的青年一代。这里回想惠特曼(2020)讲的“当代语言学研究日益重视经验和实验”“我们需要为学生提供实验语言学和计算语言学训练”很有预见性。李宇明教授和我曾共同提出:走向社会,走向田野,走向实验室,走向互联网。这或许可以为语言学的未来提供一种选择。

  文章结稿之日,惊闻著名语言学家拉波夫去世的消息,心中深切悼念这位世界语言学的巨人。他给我们留下三卷巨著《语言变化原理:内部因素·外部因素·认知和文化因素》,是国际语言学的宝贵财富。“用任何语言都难以形容拉波夫对于深化我们的语言学基本理论所做出的卓越贡献。”(王士元 2019)据我所知,拉波夫教授跟王士元先生关系密切,志趣相投。拉波夫不愿使用“社会语言学”一词,因为他坚持语言研究不应脱离社会,包括实地考察。王士元先生也已经超过90岁高龄,还在语言研究的前沿领跑,他同样一直坚持语言研究应该伴随着实证方法。2012年,这两位语言学大师曾在香江实现了历史性的重聚,记录在《拉波夫与王士元对话:语音变化的前沿问题》一书中,成就了语言学界的一段佳话。

 

注释

  [1] 私下交流。

  [2] 第4节和第5节写作过程中,得到王士元、曾志朗、史有为、焦立为、杨小虎、阿错、于秒、周频、杜忆、黎平等十几位师友热情帮助和睿智启发,谨致谢忱。

  [3] 2024诺奖颁奖现场,AI之父Hinton演讲:当AI已经开始理解人类的喜好和情绪(附视频),“计算机教育” ,https://mp.weixin.qq.com/s/klwTxkc6PxYOeLuywc6Rog [2024年12月12日访问]。

 

参考文献

  冯胜利、叶彩燕编,2014,《拉波夫与王士元对话:语音变化的前沿问题》。北京:北京大学出版社。

  石锋,2019,韵律格局:理念和方法。《实验语言学》第2期,1-8页。

  石锋,2023,语言之谜——来自人工智能的挑战。《实验语言学》第2期,1-11页。

  石锋,2024,人工智能在哪里挑战了语言学?“实验语言学+”云上论坛直播报告。

  石锋、夏全胜,2022,试论汉语普通话语句的焦点原理。《语言科学》第6期,143-157页。

  王士元,2019,前言:介绍比尔。见拉波夫著,石锋、郭嘉译,《语言变化原理:内部因素》。北京:商务印书馆。

  赵元任,2002 [1965],罗素的抽象原则跟语言教学。见赵元任著,《赵元任语言学论文集》。北京:商务印书馆。586-590页。

  赵元任,2002 [1970],理论和方法之间关系的若干方面。见赵元任著,《赵元任语言学论文集》。北京:商务印书馆。859-876页。

  赵元任,2002,《赵元任语言学论文集》。北京:商务印书馆。

  赵元任著,石锋、潘韦功译,2023,《连续性:方法论的研究》。上海:上海教育出版社。

  郑国锋译,2020,语言学,语言学流派,语言学教育:康奈尔大学语言学系主任约翰·惠特曼(John Whitman)教授访谈录。《外国语》第5期,121-125页。

  Cattell, Raymond. 1941. Some theoretical issues in adult intelligence testing. Psychological Bulletin 38, 592.

  Cattell, Raymond. 1963. Theory of fluid and crystallized intelligence: A critical experiment. Journal of Educational Psychology 54, 1:1–22.

  Gardener, Howard. 2011. Frames of Mind: The Theory of Multiple Intelligences, 3rd edition. New York: Basic Books.

  Gardener, HowardA Synthesizing Mind: A Memoir from the Creator of Multiple Intelligences Theory. Cambridge, MA: The MIT Press.

  Horn, John and Raymond Cattell. 1967. Age differences in fluid and crystallized intelligence. Acta Psychologica 26:107–129.

  Wang, William Shiyuan. 2024. Linguistics and AI. The 15th International Conference in Evolutionary Linguistics, Hunan University.

  Wei, Zhengde et al. 2023. Implicit perception of differences between NLP-produced and human-produced language in the mentalizing network. Advanced Science 10, https://doi.org/10.1002/advs.202203990. [accessed 20, Dec. 2024]

 

作者简介

  石锋,南开大学语言所名誉所长、国际中国语言学会会长、教育部国家普通话审音委员会委员。《南开语言学刊》名誉主编、《实验语言学》名誉主编、《中国语言学报(JCL)》副主编、LINGUA编委。研究领域为实验语言学、语言演化、语言接触与语言习得。论著或编著包括《语音格局—语音学与音系学的交汇点》《语调格局—实验语言学的奠基石》《听感格局—汉语语音听感特征初探》《韵律格局—语音和语义、语法、语用的结合》《秋叶集》《银龄集》等20余部。译著(合译)有赵元任《连续性:方法论的研究》,拉波夫《语言变化原理:内部因素》《语言变化原理:社会因素》《语言变化原理:认知和文化因素》,王士元《语言的探索》等。在国内外发表论文280余篇。

 

 

往期回顾 

 

《当代语言学》过刊电子版下载:    

  https://www.ncpssd.org/journal/details?gch=82143X&nav=1&langType=1    

《当代语言学》电子版微信小程序订阅: