首页
我们
党建
科研
学人
资源
教学
搜索
欢迎您访问语言研究所!

沈家煊:宋柔著《小句复合体的语法结构》序

作者:沈家煊 来源:今日语言学 时间: 2022-08-23
字号:

《小句复合体的语法结构》序

沈家煊

  处于当今人工智能的时代,从事语言本体研究的语言学家感到被冷落了。语言智能是人工智能的核心部分,然而他们的研究成果,人工智能专家不管不问,依靠大数据输入和机器自我学习,就能大致管用。这不能怪人家,要怪就怪自己,因为语言学家描写的语言现象、总结的语言规律,在从事语言工程的人看来,缺乏可操作性。有的“规律”(要打引号)覆盖性差,只见树木不见森林,有的“规律”复杂无比,甚至比语言事实还复杂。我曾经问一位专攻语言智能的工程专家,阻碍前进的瓶颈在哪儿,他回答说,机器究竟是如何处理语言的,这是一只黑箱子,我们还不清楚里面是怎么回事。看来要弄清电脑是如何处理语言的,还是先要弄清人的大脑是如何处理语言的,人脑内部处理语言的机制,虽然已经成为研究重点,但基本上还是有如一只黑箱。

  本书的作者宋柔先生,是从事计算语言学的资深专家,既有自然语言处理方面的专长,又熟悉和关心语言学本体研究的现状和进展,他相信语言学的研究只要路子对头,是可以为人工智能和语言工程做出贡献的。计算机方面我是门外汉,在通读宋先生的书稿后,不仅受到很多启发,而且有一种欣喜,一种令人耳目一新的感觉:原来汉语的语法描写和分析是可以这样进行的。

  一、标点句。记得吕叔湘先生曾经说过,汉语的语法分析不能全依据文本的标点,那是因为汉语文本现行的标点法是借鉴西方语言的标点法引进的,不能完全反映汉语口语的实际情形。但是从另一方面看,由于汉语缺乏印欧语的那种语法形态,大致反映口语中停顿的标点不能不说是从事语法分析的重要依据,也是机器认识汉语的唯一可直观的标记。本书定义的“小句”就是真实文本显示的标点句,一个标点(逗号句号)一个小句。汉语的句子只能定义为两头有停顿的片段,因此确立标点句的重要地位,是符合汉语实际的。书中举例:

  ①突然,②他听到洗手间有流水声,③警官与特警踢开门,④将洗手间内的人猛地摔倒在地并铐住,⑤经辨认,⑥正是叶成坚。

  这是6个标点句组成的话语片断(本书称作“小句复合体”),其中①⑤⑥也认定为小句,这并不奇怪,赵元任先生早就说过,汉语以这样的“零句”为根本。文本有了明确的小句标记,对计算语言学而言,这就有了可操作性。

  二、话头话身。这是作者提出的一对重要概念。汉语语法学家已经接受赵元任先生的观点,汉语句子的主语和谓语就是话题和说明,但是受印欧语语法观念的束缚,学界对话题的认识还是过于偏狭。宋先生早先提出“广义话题”的概念,现在改称“话头”,更加贴切。请看书中的例子:

  他把左手伸出来。

  他因为重感冒了。

  他曾经登上过珠峰。

  除了“他”是话头,“把”“因为”“曾经”也是话头。在传统的观念里,介连、连词、副词怎么可能看作话题呢?然而作者说,从语言的实际使用特别是对话来看,完全可以把话身看作话头的引出成分,这正是“话头”的直观意义所在:

  问:“把什么怎么样?”答:“把左手伸出来。”

  问:“因为什么?”答:“因为重感冒了。”

  问:“曾经怎么样?”答:“曾经登上过珠峰。”

  书中对话头话身结构的性质有详细阐述,并从认知上做出解释,说明它为何适合机器的处理,另外还辨析了话头和主语、话题、主位等传统概念的异同,令人信服。

  三、话头共享。汉语语法学界有人从话题出发,研究话题的延续性,也就是开头一个话题连续管辖后头多个小句。有了话头的概念,用话头共享来替代话题延续,更加贴近汉语的实际,能覆盖的语言事实就更广了。共享这一概念还能覆盖话头话身的套接现象,即话身或话身的一部分成为新的话头。请看书中的例子:

  王老师生病了,(1)

  今天李老师来上语文课,(2)

  同学们觉得很新鲜。(3)

  其中(1)是话头,(2)是话身,(2)又成为(3)的话头,也就是(2)兼为话头话身,是前后小句的共享成分。按赵元任的说法,这种递系式结构正是汉语的造句精神所在。作者还特别论述,这种套接结构有如几何学论证的“双父共享结构”,其树形图不是单向的左分叉或右分叉,而是双向分叉的对称结构,这使我们对汉语的造句精神有了更深刻的认识。作者还辨析了话头共享和话题缺省、零形指代等传统概念的异同,指出前者比后者的合理和优越之处。书中还描述了各种话题共享的模式及其计算方式。当前语言学关注语言的互动性,在互动性的观照下,一切文本都具有互文性,话头共享正是互文性的体现。

  综合起来,话头话身结构以及话头共享结构的提出,大大加深了我们对汉语流水句构造原理的认识。过去我们只知道汉语特多流水句,可断可连,但是对于流水句是怎么在语义上衔接连贯起来的,不甚清楚,现在本书依照逻辑语言关系把一维文字流转化为换行缩进的二维图式,就清楚多了。

  四、全覆盖性。除了可操作性和简单性,这也是作者追求的目标。全覆盖是指,提出的一套分析和操作程序要覆盖所有的文本,不论语体。作者分析处理的对象涵盖各种语体的真实文本。语体的差异以及对语体差异的研究固然重要,但是在总体上弄清楚汉语造句和文本构造的精神和原理,就目前而言无疑是更加重要的。

  难能可贵的是,作者认为这一套基于汉语事实的分析操作程序也可以覆盖英语等西方语言,并且在书中专列章节加以比较和演示。我想到英语的后置定语从句:

  He is a man (that) you can safely depend on.

  他的为人,你可以信赖。

  汉语的习惯表达不是“他是一个你可以信赖的人”,而是采用上面那样的话头话身结构。如果在那个英语句子的man后头加个逗号,取消关系代词that,那岂不就是一个话头话身句?

  一百多年来的汉语语法研究,基本上是学习和借鉴西方语法的分析方法和理论,是向西方看齐,现在作者先避开西方语法的主干主谓结构(也避开词类分别、单句复句分别),尊重汉语的实际,建立话头话身结构和话头共享结构,结果发现它具有普遍价值,从而也可以让西方向东方看齐,具体说,就是把主谓结构看作话头话身结构的一个特例。

  上面四点是我阅读书稿后的主要收获和感受,书中还有许多给人启迪的亮点。我相信,此书的出版一定会引起关注,从事语言本体研究和各种应用研究的人都能从中汲取新的知识和思想,推动我们一步步打开黑箱,洞悉人脑和电脑如何处理语言的秘密。

沈家煊

2021.4.23

《小句复合体的语法结构》

作者:宋柔

商务印书馆出版

 

简介

  宋柔教授新著《小句复合体的语法结构》日前由商务印书馆出版。

  小句复合体是小句之上的语法层面。本书基于汉语和英语的小句复合体语料库建设,提出话头话身关系和成分共享机制的概念。在二维图景下揭示出话头话身结构的语法模式及其语法语义性质,以及成分共享机制的特征。话头话身关系是汉英小句的基本结构关系,话头话身结构的成分共享机制是构建这两种语言小句复合体的基本语法手段。通过对比汉英小句复合体语法结构的异同,设计了一种英汉机器翻译模型。本书的研究工作追求对语料的全覆盖和对语言现象的可操作,注重认知解释,以便服务于计算机处理和认知科学研究。

  该书后记引用了马希文先生的一段话:“用计算机做语言处理,要求我们彻底从事实出发,而不是从观念出发。这实际上是对各种语法理论的一种严峻考验,使其缺陷得到充分的暴露。纠正这些缺陷,看来必须动大手术;当然,这也意味着汉语语法研究有了新的动力,有可能来一次大步迈进。”宋柔先生这部新著是对汉语语法研究的一次有益尝试。

 

作者简介

  宋柔,北京语言大学信息科学学院创院院长、荣誉院长、银龄学者,资深计算语言学家。在人工智能程序设计语言、汉语自动分词、汉语计算机辅助校对、汉语自动简繁转换、汉语字词属性检索、开放性汉字字形形式化、汉语词性、小句复合体语法结构等方面取得理论成果并开发了相应的软件。

上图为《瞭望周刊》为宋柔先生拍摄的工作照

宋柔先生在会中