1.AI对语言学理论的挑战
AI的新进展,使辛顿(Hinton)有足够的底气来嘲讽乔姆斯基(Chomsky)的生成语法理论。辛顿的这一嘲讽,可广义地理解为对整个语言学界的批评,他只是以语言学界主流之一的生成语法为整个语言学界的代表,因此这应该引起整个语言学界的思考。面对AI新突破的挑战,我们固然不必像乔姆斯基那样去否定,说“但这并非真正的语言”,甚至认为那是“高级剽窃”;但也不必因此丧失信心,妄自菲薄,要沉得住气。这一轮AI的突破,语言学理论基本没用上,不等于以后的科技突破也用不上。
辛顿所说,也可狭义地理解为仅仅针对生成语法的批评。这种批评并不新鲜。事实上,在语言学内部,对生成语法的种种批评也一直没有停止过,特别是来自功能语言学派的,如Comrie曾说过“给个名称不等于解释”。功能学派强调外部解释,而生成语法认为语言是个独立、自足的机制,因此强调内部解释。强调语言机制的独立、自足,导致对许多跟语言密切联系的现象的忽视。如乔姆斯基(1956:3)曾说“语言学主要研究在某个单纯的话语社区的理想的说话-听话者,他充分掌握了这种语言,并且不受那些跟语法无关的因素的影响,如记忆限制、分心、兴趣转移以及其他种种在具体运用中发生的失误(包括偶然性的或特色性的)。”这样限制“纯语法”的范围,有推动研究深入的积极意义,但我们也不能忽视语音、语义、语用等因素与语法的互动,也就是不能忽视“大语法”的研究。在科学研究中,强调不同方面的不同学派之间应该保持适度的张力、平衡,长期一家独大不是健康的学术生态。
对认知科学作出重大贡献的Miller(1956)首先指出,人类信息处理的限度是七个左右(7±2)信息块[1]。但他也承认这种数量限制难以用于分析、解释人类语言结构,“我们通常能够把一个20个词组成的句子听过一遍之后加以复述。这句子包含多少单位?100个字母?30个音节?20个词?6个短语?2个分句?抑或1个句子?我们可以知道它包含了大约120比特的信息,因为比特的定义独立于我们对句子的主观组织。但是信息块的本质是它是人为的。例如,一个除了字母外对英语一无所知的人会认为这句子里有100个单位;但一个英语很好的人会认为这句子里只有6个单位。我们不能离开了听者去定义组织的单位。”(Miller 1965:134)
不过,根据依存语法的实践(刘海涛 2009),组成一个句子的成分(根词、支配词,即核心词及其所有依存语)的数量不会超过七个左右(7±2)。这恰恰证明了Miller“七个左右”完全适用于人类语法。根据语序类型学的研究,组成一个语序片段(如短语、句子)的“直接成分”(direct constituent, DC)[2],也不会超过七个左右,如Dryer(1992)提出的主要成分(major constituent)分析法。
事实上,Miller自己也觉察到“一个英语很好的人会认为这句子里只有6个单位”[3]。Miller在20世纪50年代至60年代,跟乔姆斯基有过密切的合作,他对“七个左右”能用于人类语言表示悲观的怀疑,很可能受生成语法树形图中对结构主义直接成分分析法的沿用的影响。其实,他所谓的“英语很好的人”,即英语母语者,完全符合乔姆斯基对“理想的说话-听话者”的定义。这个“理想的说话-听话者”显然是受到“七个左右”这个限制的影响的。
诞生于20世纪60年代的当代语序类型学(Greenberg 1963),在前三十年的蓬勃发展中,虽然没有一个明确定义的“语序单位”[4],但所有研究者在具体分析时都不约而同地采用了依存语法那样的多分法。可见,这种以核心为导向的多分成分,具有极大的心理现实性。但乔姆斯基至今仍不承认“短时记忆限制”在语言机制中的地位。
辛顿对生成语法的另一个批评是,“从来没有提出过任何一种有关语义的理论”,而像依存语法那样限度为“七个左右”的有限多分,显然是建立在语义基础上的。以反映“事件”的动词谓语句来说,这种多分就是由代表事件类型、作为支配词(核心动词)的动词,加上各种反映事件参与者、作为依存语的各种短语所组成的。依存语法在计算语言学中得到卓有成效的广泛运用,显然跟它对语义结构的强调有关。
2.AI对人类智慧的挑战
AI的新进展,也使人类理智面临巨大挑战。AI 似乎具有某种创造能力。人类社会的体力劳动、大量脑力劳动、甚至创造性脑力活动,都越来越多地被机器所替代,那么人类存在的价值何在?
我觉得对此挑战,我们首先要持开放的态度。只要能解决实践问题,我们就只好承认AI也能思维。“实践是检验真理的唯一标准”同样适用于此。只是AI的“硅基思维”的具体过程跟人类的“碳基思维”不同而已。我们不能过分以“(碳基)人类中心”为标准而去否认其他形式的“思维”以及智慧生物。
事实上,人类的“碳基思维”和AI的“硅基思维”必然都有各自的特点、各自的优劣长短。重要的问题是如何发现彼此的优劣,从而启发我们去更好地实现两种思维的互动互补。AI的明显优点是速度快。但是人们尝试向AI提出种种问题,发现有些问题回答得不错,但也有不少问题,特别是一些内含圈套、矛盾的类悖论,甚至是荒唐的问题,AI居然也能堂而皇之地回答上一大堆废话,可见碳基思维也有明显局限性。进一步了解两种思维的不同特点、不同的所长和所拙,才能做到两种思维的和谐共处。
更何况,高科技正在逐渐地进入人类机体,人类某些器官可以用人造的、机械的、AI的部件去替代,将来大脑中某些功能的部位肯定也可以这样。也就是说,人类和AI将逐渐融为一体。
其实,跟任何工具、科技一样,AI也是一把双刃剑,可以用来做善事,也可以用来做恶事。关键在于人类如何善用它们,这才是人类面临的新挑战的关键。要阻止技术的发展是不可能的,我们只能接受这种挑战,尽量善用它们。
人类对技术的发展和未来的展望,自古就有保守性的和进取性的两类。前者以“桃花源”为例,在这个保守的乌托邦中,社会是停滞而平静的,那里的人们超脱于外部世界的纷扰,小国寡民,“不知魏、晋”朝代之变迁,过着悠哉游哉的生活。后者就是各类大同世界理想国乌托邦,其中物质生产高度发展,所有人的潜能充分实现。非常可能的是,同保守的理想国相反,那里人们的生活将是十分紧张而辛苦的。
应该说,两种乌托邦是两个极端。理想的状态应该是社会以适合人类适应能力的速度发展。社会如果不发展、不进步,没有新事物,没有新的希望和梦想,人们就必然感到厌倦、无聊。但是如果新事物高速度层出不穷,人们又会感到压力太大而穷于应付。
人类自诞生以来,由基因结构决定的适应能力并没有发生根本性的突变。但是现代社会却加速发展,现代人的神经因而日益紧张。Alvin Toffler在《未来振荡》(1970)中曾预言:未来人类面临的振荡程度,将类似于亿万年前人类祖先被缩小的海洋抛到新生的陆地上时所面临的因环境激变而导致的振荡;并且警告:除非人类能迅速地学会控制个人对时髦的盲目追求和整个社会的变化速度,否则我们将注定要遭到适应能力普遍崩溃的厄运。
科学家曾做过一些实验,如将孩子熟悉的和陌生的玩具分别装在6个盒子中,每个盒子中装5件玩具。每个盒子中新鲜玩具和熟悉玩具的比例不同——五熟、一熟四新、二熟三新、三熟二新、四熟一新、五新,让孩子们任意挑选其中的一个盒子,结果都是新玩具的和都是旧玩具的盒子没有人挑选。类似的动物实验也有过。这些实验都表明:动物(包括人)如果有选择的自由,一方面,它将拒绝完全的陌生,那意味着高度的不确定性和危险;另一方面,它又会不由自主地试探有限的陌生。为什么动物的天性会是这样?生物演化中的自然选择作出了解释:彻底地追求新奇,常常会把自己置身于危险中;彻底地躲避陌生,将无以开发新的生存空间。这两种极端天性都会在生存竞争中被淘汰。所以动物和人类都倾向于寻找适度的新奇和刺激,同时也拒绝过分的新奇和变化。
我们由此想到“可适应性发展”问题。社会发展过激,使人难以适应。“可适应性发展”不仅考虑到后代的可持续发展,同时也不牺牲当代人的福祉,具有更深的“人本主义”精神。
跟任何事物走向极端就会异化一样,我们必须承认,科技进步也是如此,也会异化。面对高科技和AI的飞速发展,我们在欢迎的同时,对其可能的被滥用,不能不保持冷静和警惕。总之,以平常心待之,既不必为此异常兴奋激动,也不必如遇洪水猛兽,恐慌不已。事实上,历史上每次科技的重大突破和产业革命,都会导致一些盲目的乐观和恐惧,但科技进步终究会稳步进行,后之视今犹今之视昔。
注释
[1] 这一数字长期、广泛地被误解为仅仅是“短时记忆”的限度,极大忽视了它在人类认知中的广泛应用。
[2] 这里的“直接成分”不等于层次分析法的“直接成分”(immediate constituent, IC)。
[3] 这里单位就是“短语”。组成一个句子的所有“直接成分” (DC)都无遗漏地计算进去,加上一个不是依存短语的核心词,那就是七个了。
[4] Greenberg (1963) 把“语序”用the order of meaningful elements表达,即认为“语序单位”就是meaningful elements。可见他意识到用word order表示“语序”这个概念的不妥。直到20世纪90年代初,Dryer(1992:112-115)才给“语序单位”一个操作性定义,即“主要成分”(major constituent),其结果跟依存语法的多分完全一样。
参考文献
刘海涛,2009,《依存语法的理论和实践》。北京:科学出版社。
Chomsky, Noam. 1965. Aspects of the Theory of Syntax. Cambridge, MA: The MIT Press.
Dryer, Matthew. 1992. The Greenbergian word order correlations. Language 68, 1:81-139.
Greenberg, Joseph H. 1963. Some universals of grammar with particular reference to the order of meaningful elements. In Joseph H. Greenberg, ed., Universals of Language, 2nd edition. London: The MIT Press. Pp.73-113.
Miller, George. 1956. Human memory and the storage of information. I.R.E. Transaction on Information Theory 2, 3:129-137.
作者简介
陆丙甫,北京语言大学,教授。研究领域包括语言类型学、句法理论和认知语言学。代表作有“无限递归的条件和有限切分”和《核心推导语法》。
往期回顾
《当代语言学》过刊电子版下载:
https://www.ncpssd.org/journal/details?gch=82143X&nav=1&langType=1
《当代语言学》电子版微信小程序订阅: