首页
我们
党建
科研
学人
资源
教学
搜索

特别策划 | 邓盾:借辛顿之名跟有志于语言本体研究的同学聊几句

作者:邓盾 来源:今日语言学 时间: 2025-02-25
字号:

  在文本的理解和生成上,大语言模型取得了突破性进展。以此为据,辛顿对乔姆斯基大加挞伐。不久之后,辛顿获得了2024年诺贝尔物理学奖。这一系列的事件让很多人对理论语言学,尤其是对生成语言学,产生了深深的怀疑。我个人一直在生成框架下从事汉语词法和句法的研究。很真诚地讲,虽然当下四周有很多怀疑甚至否定的眼光,我仍有高度的道路自信。我想借这个机会谈谈为什么在当前的大环境下,我对语言本体研究,尤其是生成框架下的汉语研究仍满怀信心。抛出些许石块瓦砾,或许对将来有志于从事理论语言学研究尤其是汉语语法研究的同学有那么一点攻玉之用。

  先简要说说我为什么对语言本体研究怀有信心。理由很简单:机器不具备独立自主提出研究问题的能力。作为一名大学教师,我想向诸位同学着重强调提问能力的重要性。在我看来,提问能力不仅是区分机器与人的重要标准,也是鉴别学人和学术团体研究水平高低的重要标准。唯有优秀的研究者才能提出具有深度的研究问题,唯有优秀的学术共同体才能集体探讨深刻的研究问题。目前为止,大语言模型仍是一个被动执行任务的工具,它不能独立自主、积极主动地提出任何有关自然语言的、有深度的研究问题,遑论去对问题加以探索。想解开语言方方面面的谜团,仍要寄希望于语言本体研究。因此,对横空出世的大语言模型,有志于探索自然语言奥秘的人不应该感到恐慌,反而应该觉得高兴才是,因为在探秘的路上,多了一件好用的工具。有这件利器的加持,对自然语言充满好奇、喜欢提问的年轻学子有了更多的理由投身到语言本体研究的大业中来。

  下面着重讲一讲我为什么对生成框架下的汉语研究怀有信心。理由很多,囿于篇幅,我只讲两点。

  第一,生成派是提问题的行家里手。在近七十年的发展历程中,生成派挖掘出了海量的语言现象,提出了大量的研究问题,并对这些问题做了深入的研究。上述三个方面,无论是哪个方面,在人类语言研究的历史上都是前所未有的。因此,熟谙生成派的研究积淀和研究范式,有助于培养一个人提问的能力,有助于提升一个人提问的眼光。为避王婆之嫌,下面我举一个具体的例子对此加以说明。

  辛顿力挺大语言模型,乔姆斯基看不起大语言模型。两人观点的分歧牵涉到方方面面,其中一个非常重要的争议是如何看待线性顺序(linear order)与层级结构(hierarchical structure)在自然语言句子生成与理解中的作用。以辛顿为代表的大语言模型支持者取一端的观点:句子的生成和理解只需要依赖线性顺序,可以无视层级结构。以乔姆斯基为代表的很多生成句法学家则取另一端的观点:句子的生成和理解主要基于层级结构,线性顺序只起非常边缘的作用。现在的问题是,如果我们借助汉语的现象来审视上述争议,相关的语言事实是什么?针对这些事实我们可以提出哪些研究问题?如何借助这些问题去反观上述争议?如果熟悉生成句法的研究,尤其是了解乔姆斯基近期的一些论著(如Berwick和Chomsky 2017),不难想到并造出下面的汉语句子。

  (1)

  a. 偷偷地,坐在门边的学生离开了教室。

  b. 偷偷地坐在门边的学生离开了教室。

  c. 坐在门边的学生偷偷地离开了教室。

  d. 坐在门边的学生离开了教室,偷偷地。

  e. 偷偷地,张三的朋友告诉他离开教室。

  f. 张三的朋友偷偷地告诉他离开教室。

  g. 张三的朋友告诉他偷偷地离开教室。

  h. 张三的朋友告诉他离开教室,偷偷地。

  针对上述句子,我们可以提出如下研究问题。

  问题一:(1)中每个句子里的“偷偷地”语义指向句中的哪个成分(即和哪个成分产生语义上的关联)?

  问题二:如何解释上述句子里的“偷偷地”在语义指向上的差异?

  问题三:“偷偷地”代表的副词在句子中的语义指向有无规律?若有,该规律应如何表述?它是否具有跨语言的普遍性?

  问题四:副词在语义指向上的跨语言规律体现了自然语言音义匹配方面的什么特点?这种特点对刻画人类的语言能力有何启发?

  据我所知,后三个问题在汉语文献上没有人研究过,当然也就没有现成的答案。我个人认为这几个问题是不错的研究课题,可以用来做本科甚至硕士毕业论文,有兴趣的同学可以尝试。基于我个人的亲身体验以及我看到的很多生成学人的经历,可以负责任地说,当学了生成语法并真正登堂入室之后再来看汉语,会发现可研究的现象很多,问题也很多。有了材料和问题,何愁无研究可做?正因为如此,我才对汉语本体研究的前景抱有信心。

  我对生成框架下的汉语研究怀有信心的第二点理由是,生成派是理性主义的拥护者和坚持者。理性主义者对逻辑思维和批判性思维高度重视,不轻信不盲从。在我看来,这是一个好的研究者必备的重要品质。下面我再举例说明。

  在人类提问的帮助下,大语言模型可以对问题一所代表的经验问题给出相当精准的回答,这正是辛顿批评乔姆斯基走错了路的底气。但在旁观辛顿对乔姆斯基的批评时,一个理性的人会说,“等等,真的是这样吗?机器能准确回答问题一这类问题,是否意味着机器和人有着相同的语言理解和生成机制?”仔细琢磨一下,情况似乎并没有那么简单。我们看到的情况是,大语言模型和人在回答问题一这类经验问题时的表现并不一样。人的回答具有不同个体间的同质性和稳定的准确性,而大语言模型的回答既不是千篇一律的也不是稳定准确的:这个模型软件和那个模型软件对相同问题的回答经常表现迥异,相同的软件在一年前和在今天,回答问题的准确性也不尽一致。机器和人的这种表现差异该怎么解释?就算有一天大语言模型对问题一这类经验问题的回答与人类趋同了,问题仍旧存在:大语言模型对自然语言句子理解和生成的方式与人类理解和生成句子的方式一样吗?若把理解和生成自然语言句子的能力比作罗马,理论上来说,通向罗马的大道可能不止一条。大语言模型今日的成就,是向世人展示了机器有朝一日或许可以抵达罗马。但这并不意味着人也是在同一条道路上到达罗马的。我想借助这个简单的例子来说明,当一个人有了这种“钻牛角尖”的习惯和“抬杠”的能力后,研究的问题也会随之而来,因为总能发现前修未密之处。

  言不尽意,就此打住。最后谈一点个人的感悟。辛顿认为机器和人在语言的理解和生成上并无二致,正因为如此,他反复强调AI的风险,呼吁加强管控,因为他忧虑AI会对人类造成伤害。乔姆斯基认为机器和人在语言的理解和生成上全无共性,是语言使得人在地球上独一无二。尽管两人在语言理解和生成的认识上观点迥异,但他们都展现出了对人的高度重视和关怀,这对我触动很大。非常惭愧,我个人既没有本事搭建大语言模型,对普遍语法的研究和揭示也力有不逮,唯一力所能及的是做一点汉语语法体系构建方面的探索。我真心希望国内的后来人中可以涌现出一批研究者,能够在大语言模型等新兴工具的助力下做好语言本体研究,让我们可以更好地认识人自身,甚至可以造福全人类。

 

参考文献

  Berwick, Robert C. and Noam Chomsky. 2017. Why Only Us: Language and Evolution. Cambridge, MA:The MIT Press.

 

作者简介

  邓盾,男,博士,香港中文大学中国语言及文学系副教授。研究领域为生成框架下的汉语词法句法研究以及语言资源建设。新近代表作有:“从‘区别词’看现代汉语词的界定”“单双之辨、高低之分、有无之别:论现代汉语表达来源语义的增价结构的句法”。

 

 

 

往期回顾   

 

《当代语言学》过刊电子版下载:     

  https://www.ncpssd.org/journal/details?gch=82143X&nav=1&langType=1     

《当代语言学》电子版微信小程序订阅: