辛顿的获奖感言翻译成汉语只有6000字左右,但信息量很大。对传统的语言研究者而言,有些说法可能不是信息量大小的事,而是革命性的新论了。有关数智时代语言学的挑战与机遇,此前我已经在各种场合说了不少,限于篇幅,这里我就下面几点,简单谈一下。
辛顿说“语言学家被一个叫乔姆斯基的人误导了好几代”。我估计“误导”这个词会使大多数主流语言学家感到不适。不适的原因可能在于,乔姆斯基开创的语言学流派,在对于“什么是语言?”“语言学家的主要任务是什么?”等问题上,与传统语言学流派或大部分普通人可能有不同的理解。语言学作为研究语言的学科,有时也被认为是人文学科中最具科学特质的学科。如果语言是一个系统,那语言学家的根本任务可能就在于探究语言系统运作的规律。又因为大多数人认为“语言最主要的功能是交流”,那么,语言学家可能就需要从真实的语言交流中发现系统的规律。否则,将语言抽象为纯形式的数理体系所发现的种种规律,是很难解释现实语言现象的,更谈不上被其他需要语言规律的领域使用了。词汇功能语法的创立者布利斯南(Joan Bresnan)在2016年获得计算语言学会的终身成就奖时,发表了一个题为“语言学:花园与灌木丛”的获奖感言,号召语言学家走出花园,来到灌木丛。这当然不意味着,花园里的工作不重要和没必要,但由于现代社会更需要的是灌木丛的生长机理,所以我们需要转向。从这个意义上讲,乔姆斯基可能并没有误导任何人,只是我们现在比70年前更需要了解语言系统的真正运作规律,因为机器已经走在人前面了。
辛顿也用大模型神经网络的成功给乔姆斯基的语言天赋论戴上了一顶“疯狂”的帽子,尽管乔姆斯基为了说明天赋论的合理性,曾经拿人与石头、兔子以及电话交换机做过一些近乎“疯狂”的比较,但他的理论并不是完全没有学习,只是在他与他的追随者们过于强调天赋的巨大声浪中,人们容易忽视了学习而已——正如人类语言不是一个非黑即白的系统,而是一个介于黑白之间的连续概率系统一样,先天与后天之争其实也是一个度的问题,不能简单地用yes/no来分类。数智时代的语言学家需要习惯语言的这种概率性和连续性,并学会用“在这种语境下大多数人会这么说”来代替“这个句子符合语法,那一个不符合”。而要做到这一点,没有数据是不行的。
在说完学习的事后,辛顿又说,乔姆斯基的理论全是关于句法的,从来没有提出过任何一种有关语义的理论。我个人认为,这一点可能是主流语言学理论在数智时代失灵的关键。为什么?因为语言是一个系统,句法只是其中的一部分,哪怕就算是最重要的部分,也不能等同于整体。换言之,尽管主流语言学几十年来都在大力推进语言(句法)的形式化研究,力图寻求语言的普遍形式规律,但任何一位普通的语言使用者都明白,作为交际工具,表达意义、传递意义才是语言得以存在的根本。离开意义、离开人的语言研究,无论从什么角度看,都是不完备的。抛弃主流语言学的数基大模型,不仅取得了前所未有的成功,也给了辛顿调侃乔姆斯基的底气。可以说,大模型的成功就是意义的表征与处理的成功。
尽管辛顿把大模型在语义处理的成功归结于语言学的词间关系网和心理学的特征理论,但实际上基于人工神经网络的数智体在处理语义时用到的底层逻辑与主流语义学中那些基于分解的义素、义场等方法是很不一样的。我们曾经说过,“基于深度学习的自然语言处理领域取得突飞猛进的发展,在很大程度上比以前更好地实现了维特根斯坦‘意义即用法’的思想。这种方法不仅解决了语义不可分解的难题,也得到了可比的词义平均值。这个值能随着使用的变化而变化,学得越多懂得也越多,不仅充分反映了语言的概率性,也解决了自学习的问题。”(刘海涛 2022)顺着辛顿的说法,大模型由于采用人工神经网络技术,所以能更好地将“意义即用法”的想法参数化、特征化、层级化、网络化,使过去难以实现的基于特征的大规模语义处理机制变得可行了,进而在人类语言的意义处理领域取得了突破性进展,而驱动这一切的动力与资源就是人类交流过程中产生的语言(文本)材料。这种数据驱动的转向也可从辛顿个人主页先后引用的盖瑞·马库斯(Gary Marcus)的两段话中看出。关于层级特征检测器无法处理语言的引语,辛顿在获奖感言中已有提及,而新的引语则成了马库斯的下面一段话:It gloms on to different clusters of text. That is all.
所有这些,对主流语言学家而言,可能都是陌生的,是难以理解的。但正如辛顿所说,“如果有人告诉你这种模型不像我们,跟我们完全不同。你就问他,那人类语言是怎样工作的?”他可能会告诉你,用S→NP,VP; NP→Det,N之类的规则。但计算语言学几十年的实践已经证明,这样的规则无法像大模型一样处理现实世界的人类语言,因为语言是一个人驱概率系统,研究语言不能完全脱离人,不能脱离人类交流的真实语言,形式化、数理化固然是科学研究的有效手段之一,但心理现实性也是一个需要关注和考虑的问题,否则就应验了吕叔湘先生说的“语言是什么?说是‘工具’。什么工具?说是‘人们交流思想的工具’。可是打开任何一本讲语言的书来看,都只看见‘工具’,‘人们’没有了。”(吕叔湘 1983:112-113)“人们”没有了,后果很严重。大模型将人们请了回来,所有的知识均来自人们说的话、人们在交流中说的话,所以它成功了,遗憾的是,这种成功是在抛弃了语言学家后取得的。
这便引出了数智时代的语言学家和认知科学家需要回答的两个基本问题:为什么用我们能理解的方式,机器做不好?为什么机器能这样做,我们却理解不了?更具体一点,今天的语言学家需要在数智时代智能生成的链条“文本→模式→知识→网络→智能”中,尽快找到自己的位置。只有这样,语言学家才有可能从鲜活的人类语言使用中发现更具解释力和预测力的人类语言系统的运作规律,助力以人为主导的“人机智能共同体”的形成,进而为数智时代的发展贡献自己的智慧。
参考文献
刘海涛,2022,数智时代语言研究的挑战与机遇。《中国社会科学报》2022年5月17日第8版。
吕叔湘,1983,《吕叔湘语文论集》。北京:商务印书馆。
作者简介
刘海涛,复旦大学文科资深教授,复旦大学外文学院教授、博导。教育部“长江学者”特聘教授,享受国务院政府特殊津贴专家,国家社科基金重大项目首席专家。主要研究方向:数据驱动语言学、数字人文、语言规划和依存语法。连续十年入选爱思唯尔“中国高被引学者”(2014-2023)。十多项研究成果获得教育部或省级优秀社科奖。
往期回顾
《当代语言学》过刊电子版下载:
https://www.ncpssd.org/journal/details?gch=82143X&nav=1&langType=1
《当代语言学》电子版微信小程序订阅: