首页
我们
党建
科研
学人
资源
教学
搜索
欢迎您访问语言研究所!

张永伟:语文辞书在异形词规范中的作用——以含有非规范汉字的异形词处理为例

作者:张永伟 来源:今日语言学 时间: 2021-01-26
字号:

  摘要:《第一批异形词整理表》附录中44组含有非规范汉字的异形词是涉及对错的问题,但相关研究较少。《现代汉语词典》对这44组异形词的处理可概括为三种类型,这些不同的处理方式是辞书语言文字规范功能的体现。《现代汉语词典》积极遵循语言文字规范,同时对规范做了更为合理的呈现,为规范的修订提供依据和参考。语文辞书同国家语言文字规范文件一起承担着语言文字规范功能。

  关键词: 语文辞书 非规范汉字 异形词

  一、 引言

  异形词规范是语言文字规范的重要组成部分。为了对异形词的使用进行规范,中华人民共和国教育部和国家语言文字工作委员会发布了《第一批异形词整理表》(以下简称《一异表》[1],于2002年3月31日开始试行,是异形词的国家规范。《一异表》除正文收录了338组异形词外,还在附录中收录了44组含有非规范字的异形词。语文辞书,无论是字典还是词典,都涉及异形词的收录和使用问题,是异形词规范的另一种体现,可以视为异形词的辞书规范。

  《现代汉语词典》(以下简称《现汉》)是一部权威的语文辞书,影响力巨大。许多学者针对《现汉》如何处理异形词这一议题展开了研究,如白云(2007)、苏新春(2002)、赵翠阳(2017)等。但是这些研究主要围绕《一异表》正文部分的338组异形词展开,对附录中含有非规范汉字的异形词研究相对较少。李行健在《异形词九问》中指出:“表中前面的338组异形词是取舍问题,‘附录’中的44组词是对错问题,是明确要予以废除的。”附录中44组异形词同时涉及不规范汉字的使用问题,更应该逐渐退出使用,因此它们的处理应该与《一异表》正文338组异形词的处理有所区别。但由于某些复杂的原因,其中一些非推荐词形依然在使用。因此含有非规范汉字的异形词的处理问题同样值得我们认真研究,从而引导人们正确使用。

  2013年,《通用规范汉字表》对《一异表》中近百个汉字的正异关系进行调整[2]。虽然《通用规范汉字表》不是异形词规范,但这些调整也直接影响到含有非规范汉字的异形词[3]。因此,《一异表》附录实际上仅可视为提供了含有非规范汉字的异形词的原始数据,其异形词的正确形式还需依据《通用规范汉字表》进行相应调整。《通用规范汉字表》是贯彻《国家通用语言文字法》的配套规范,语文辞书也应该采取有效措施,积极贯彻执行。

  从异形词及相关国家规范的公布和修订时间、《现汉》的出版时间来看,在过去近20年时间里,异形词等相关国家规范的试行及修订与语文辞书的修订互相引导,但语文辞书在这个过程中起到了哪些作用,还是值得我们总结和思考的。本文将考察《现汉》第5、6版[4]对《一异表》附录44组含有非规范汉字的异形词处理的变化。在此基础上,结合语料库探讨语文辞书在异形词规范中的作用。

  二、 含有非规范汉字的异形词处理及整体使用情况

  (一) 《现汉》对含有非规范汉字异形词的处理

  《一异表》附录44组含有非规范汉字的异形词中,《现汉》第5版和第6版均只涉及42组,两组未涉及的异形词为“趟地—蹚地”“趟水—蹚水”[5],这是因为它们是一般的动宾词组,不符合《现汉》的收词标准,从而未被收录。不过《现汉》第5版和第6版均收录了44组异形词中的“趟浑水—蹚浑水”,因此可以从“趟浑水—蹚浑水”来推断出《现汉》对“趟地—蹚地”“趟水—蹚水”的处理态度。

  44组异形词中,有许多异形词的非推荐词形使用了繁体字。使用了繁体字的词本身就是不规范、不推荐使用的,因此异形词规范应该更加关注其简体形式是否也不被推荐使用。《现汉》在处理含有繁体字的非推荐词形时,均使用其简体形式。比如包含繁体字的“轻颺”“椏杈”等词分别使用“轻飏”“桠杈”等代替。

  经过分析我们发现,作为国家规范的《一异表》《通用规范汉字表》与作为辞书规范典型代表的《现汉》第5、6版对含有非规范汉字异形词的处理差异主要集中在“撅嘴—噘嘴、空蒙—空濛、昆仑—崑崙([6]、渺茫—淼茫、轻扬—轻颺(飏)、趟浑水—蹚浑水”6组异形词,不同规范对它们处理的一致性如表1所示:

  表1 不同规范对含有非规范汉字异形词处理的一致性

  不同规范对异形词的处理差异可以总结为以下几点:

  (1) 《现汉》第5版与《一异表》一致,《现汉》第6版与《通用规范汉字表》一致,而与《一异表》不一致,如“撅嘴—噘嘴”;

  (2) 《现汉》第5版与《一异表》不一致,《现汉》第6版与《通用规范汉字表》一致,也与《一异表》一致,如“空蒙—空濛、昆仑—崑崙()、渺茫—淼茫、轻扬—轻颺(飏)”;

  (3) 《现汉》第5版与《一异表》不一致,《现汉》第6版维持未修订,但《现汉》第6版与《通用规范汉字表》一致,如“趟浑水—蹚浑水”。

  (二) 含有非规范汉字的非推荐词形的整体使用情况

  本文选择“《人民日报》图文数据库(1946—2019)”(以下简称《人民日报》)为语料,使用哈尔滨工业大学LTP工具[7]进行汉语分词,使用Python编程并按年份统计词频。由于《人民日报》使用简体汉字,因此我们将《一异表》附录中含有繁体字的非推荐词形转换为简体形式再进行处理,比如将“飞颺”“椏杈”转换为“飞飏”“桠杈”。

  44组含有非规范汉字的异形词共包括47个非推荐词形,表2为它们在《人民日报》中的使用情况[8]。《一异表》在2002年试行,因此我们选取1946—2001年和2003—2019年两个时间段统计《一异表》试行前后不同使用频次的非推荐词形的个数和占比。

  表2 含有非规范汉字的非推荐词形频次统计

  表2显示,含有非规范汉字的非推荐词形在各个时间段频次都非常低。在《一异表》试行前后,完全没有使用的非推荐词形分别占比61.70%和65.96%,使用频次在1—5之间的分别占比17.02%和19.15%,使用频次大于10的均为6个,合计占比约12.77%。这说明含非规范汉字的非推荐词除少数依然使用外,大部已经不再使用,异形词国家规范应该及时更新,辞书也可以对这部分内容不再提示。这样,值得关注的含有非规范汉字的异形词数量也会大大减少。

  三、 三种含有非规范汉字的异形词的处理分析

  《现汉》对表1中6组异形词的处理可概括为三种类型,“空蒙—空濛”“昆仑—崑崙()”“渺茫—淼茫”“轻扬—轻颺(飏)”属同一类,“趟浑水—蹚浑水”为一类,“撅嘴—噘嘴”为一类。本部分分析《现汉》对这三类含非规范汉字的异形词的处理方式以及它们在语料库中的实际使用情况,最终结合异形词规范的变化来分析《现汉》在这个过程中所起的规范作用。

  (一) “空蒙—空濛”的处理分析

  《现汉》对“空蒙—空濛”和“昆仑—崑崙()”“渺茫—淼茫”“轻扬—轻颺(飏)”的处理方式相同。现以“空蒙—空濛”为例进行分析。《现汉》第5版将“空濛”作为推荐词形,第6版将“空蒙”改为推荐词形。“空蒙”和“空濛”在1980—2018年《人民日报》中的使用频次倍比[9]变化如图1所示:


图1 “空蒙”和“空濛”频次倍比变化[10]

  图1显示,“空蒙”和“空濛”的频次倍比变化反映“空蒙”的使用优势分为三个阶段:“空蒙”占优势,“空蒙”的优势被“空濛”挑战,“空蒙”恢复优势。在2000年以前,“空蒙”的使用频次整体高于“空濛”;在2000—2013年期间,“空蒙”只有2年使用更占优势;在2013年以后,“空蒙”恢复绝对的优势地位。

  实际上,从1964年颁布的《简化字总表》开始,“濛”就一直作为“蒙”的繁体字,《现代汉语常用字表》(1988)也没有收录“濛”字。因此《一异表》将“空蒙—空濛”视为一组含有非规范汉字的异形词,收录于附录中。而《现汉》第5版将“濛”和“蒙”进行了分化处理,同时收录了“蒙”和“濛”。《说文解字》:“濛,微雨也。从水蒙声。”《现汉》第5版强调“濛”和“雨”有关的字义,用“濛”形容细雨,用“空濛”形容景物迷茫。《现汉》第6版认为这种分化处理不再必要,“濛”不再作为正体字,其意义由“蒙”字承担,“濛”仅作为“蒙”的“细雨”义繁体字。这样处理减少了同音字的数量,符合语言经济性原则,相应地,“空蒙”也就成了推荐词形。《现汉》第5、6版对“空蒙—空濛”相关条目的处理如下所示:

  濛 ménɡ〈书〉 容细雨:细雨其~。

  空濛 kōnɡménɡ〈书〉 形容景物迷茫:山色~|烟雨~。(《现汉》第5版)

  蒙2(濛)ménɡ〈书〉 容雨点等很细小:细雨其~。

  空蒙 kōnɡménɡ〈书〉 形容景物迷茫:山色~|烟雨~。(《现汉》第6版)

  从2005年《现汉》第5版到2012年《现汉》第6版出版,经历了8年时间。这8年中,《现汉》同《一异表》对“空蒙”“空濛”的处理不一致,但《一异表》规定的推荐词形“空蒙”只有1年使用更占优势,其余7年均是《现汉》第5版规定的推荐词形“空濛”更占优势。我们认为,语文辞书作为国家语言文字规范文件的呈现,直接面对读者,其影响有时比国家文件规范可能更大。《现汉》第6版将“空蒙”作为推荐词形,与异形词国家规范相一致。

  “空蒙—空濛”代表了异形词辞书规范与国家规范处理不同,国家规范不变,语文辞书向国家规范靠拢的情形[11],其处理体现了语文辞书对异形词国家规范的严格遵守、积极落实。虽然“空濛”更符合单字字义,但当语文辞书的收词与异形词国家规范标准相左时,语文辞书也应该积极落实国家规范,“单字条目”与“多字条目”协调处理,同国家规范保持一致。

  (二) “趟浑水— 蹚浑水”的处理分析

  《现汉》第5、6版均将“蹚浑水”作为推荐词形。“趟浑水”“蹚浑水”在《人民日报》中的使用频次较少,无法反映二者的实际使用情况,但我们可以借助“趟水—蹚水”来进行统计分析。虽然“趟水”“蹚水”一般为动宾词组,但汉语信息处理领域的自动分词工具往往将它们视为一个完整的切分单元。“趟水”和“蹚水”在1980—2018年《人民日报》中的使用频次倍比变化如图2所示:


图2 “趟水”和“蹚水”频次倍比变化

  图2显示,从1980年开始,“趟水”的使用从优势明显,到逐渐失去优势,最终彻底失去优势。在2002年以前,“趟水”的使用频次整体高于“蹚水”;在2002—2006年期间,“蹚水”使用得更多,与《一异表》的规定不符,直到2010年才短暂地出现“趟水”使用更多的情形。从2012年开始,“蹚水”的使用优势又开始明显,远大于“趟水”。

  “蹚水”使用优势的变化同异形词相关规范的发布时间密切相关。从1955年发布的《第一批异体字整理表》开始,“蹚”就被视为“趟(tānɡ)”的异体字,《一异表》的规定也符合通用性规则。但是《现汉》第5、6版均将“趟(tānɡ)”和“蹚”作为两个独立的正体字出条[12],没有将“蹚”作为“趟(tānɡ)”的非规范字形。江蓝生(2013)介绍《现汉》第6版对异形词的处理时指出:“‘趟’读去声tànɡ,为量词;‘蹚’读平声tānɡ,为动词,二者分工明确,故只出‘蹚地、蹚浑水’条(‘蹚水’为例词)。读作平声的‘趟’tānɡ是‘蹚’的异体字,注为:旧同‘蹚’。”这样的分化处理使得“趟”和“蹚”均只有一个读音,减少了多音字数量,“蹚浑水”也自然成了推荐词形,这与《一异表》的规定不一致。2013年发布的《通用规范汉字表》也明确“蹚”为规范汉字,用于“蹚水”“蹚地”等,“蹚”不再作为“趟(tānɡ)”的异体字,“趟”也取消了tānɡ音,只保留tànɡ一个读音。

  在国家规范修订期间,辞书规范同国家规范不一致,“趟水”和“蹚水”均有使用更占优势的时候,说明这段时期异形词的使用产生了混乱。但是随着国家规范的修订,“趟水”使用优势的逆转,异形词使用混乱的情形得以有效遏制。

  “趟水—蹚水”代表了辞书规范与国家规范不同,国家规范进行修订,最终两种规范达成一致的情形。语文辞书对待国家规范不能盲目落实,依然需要科学考证,为国家规范的修订完善提供依据。

  (三) “撅嘴—噘嘴”的处理分析

  《现汉》第5版将“撅嘴”作为推荐词形,第6版将“噘嘴”改为推荐词形。“撅嘴”“噘嘴”在1980—2018年《人民日报》中的使用频次倍比变化如图3所示:


图3 “撅嘴”和“噘嘴”频次倍比变化

  图3显示,在2006年以前,“撅嘴”和“噘嘴”各自的使用优势互相交替,均不明显;但2006—2013年间,“撅嘴”的使用优势更为明显;2014年开始“撅嘴”的使用优势彻底丧失,被“噘嘴”取代。结合异体字、异形词规范的发布时间不难看出,虽然1955年发布的《第一批异体字整理表》中将“噘”视为“撅”的异体字,但在《一异表》试行之前,“撅嘴”的使用优势并不明显,《一异表》试行后,“撅嘴”才作为推荐词形,使用更占优势。《现汉》对“撅嘴—噘嘴”的处理同样跟对字的处理有关系。《现汉》第5、6版均将“撅”和“噘”作为两个独立的正体字出条,承认了“噘”的合法地位。《现汉》第5版认为“撅”和“噘”都有“翘起”的意思,不同的是“撅”可以用于“嘴”和“尾巴”,但“噘”只能用于“嘴”。相应地,《现汉》第5版只收录“撅嘴”,没有收录“噘嘴”,处理方式与《一异表》一致。对此,张书岩(2006)认为,“既然已经承认了‘噘’的合法地位,不如彻底分化,以‘噘’专表噘嘴的意思。”《现汉》第6版确实这样进行了处理,通过举例和括注方式说明“撅”用于“尾巴”,“噘”用于“嘴”,相关复音词由“撅嘴”改为“噘嘴”。“噘嘴”改为推荐词形后,“撅”“噘”“噘嘴”的表义也更加明确了。《现汉》第6版和《通用规范汉字表》的处理方式一致,它们对推荐词形重新认定后,“噘嘴”的使用开始更占优势。

  撅1 juē ① 翘起:~嘴|~着尾巴。② ……

  撅嘴 juē∥zuǐ 翘起嘴唇,表示生气或不满;别老撅着嘴啦,我给你赔不是还不行吗?

  噘 juē同“撅1”①,用于“噘嘴”。(《现汉》第5版)

  撅1 juē ① 翘起:~着尾巴。② ……

  噘 juē 翘起(嘴唇):~嘴。

  噘嘴 juē∥zuǐ翘起嘴唇,表示生气或不满:别老噘着嘴啦,我给你赔不是还不行吗?(《现汉》第6版)

  “撅嘴—噘嘴”代表了语文辞书的处理遵从国家规范,而后又参照新的国家规范进行修订的情形。《现汉》第6版对“撅嘴—噘嘴”的修订,同国家规范修订目的一样,希望能引导人们对“撅”和“噘”、“撅嘴”和“噘嘴”的使用更加规范,既让“撅”和“噘”的表义更加明确,也实现了辞书规范同国家规范的一致性。  

  四、 结语

  通过分析《现汉》异形词的处理和《人民日报》中异形词的使用情况,我们发现:

  (1) 《一异表》附录的44组异形词是对错问题,而且大部分已经弃用,异形词国家规范应该及时更新。作为一种国家语言文字规范的载体,语文辞书主要用来引导读者正确使用推荐词形,摒弃非推荐词形,因此,对这部分非推荐词形已经被弃用的异形词可以不再提示,以免造成干扰。

  (2) 语文辞书虽然不是国家规范,但是直接面向普通读者,对异形词的使用同样起着积极的引导作用。

  (3) 《现汉》在尽力落实国家规范的同时,也在一些问题上坚持自己的学术观点,最终为规范的修订提供了依据和参考。

  (4) 当辞书规范和国家规范文件不一致时,会给读者造成困扰,使得异形词使用发生混乱。

  经过近20年的规范,《一异表》附录中44组异形词中大部分非推荐词形已经渐渐被弃用,人们的用词越来越规范。在这段时期内也发现异形词国家规范存在处理不当的地方。因此,语文辞书规范一方面应积极落实国家语言文字规范,另一方面也应对国家语言文字规范进行分析和甄别,不进行任何研究全盘执行,不利于语言健康发展。语文辞书应该在参考国家规范的基础上,进一步研究,提出处理意见,为更高层面的国家规范的修订提供实践经验。此外,本研究也提醒我们,《通用规范汉字表》间接影响了《一异表》的部分规定,事实上,我们判断异形词规范与否已经不能单纯地完全依靠《一异表》,还需要参考《通用规范汉字表》中与异形词相关的汉字的规范,异形词规范的修订势在必行

  附注:

  [1]在许多文献中《第一批异体字整理表》也简称为《一异表》,本文主要讨论异形词问题,因此将《一异表》作为《第一批异形词整理表》的简称,为避免读者混淆,特此说明。

  [2]比如将《一异表》中视为其他汉字异体字的“噘、菉、淼、蹚、劄”等确认为规范字,将“桠、飏”等作为“椏”和“颺”的类推简化字。

  [3]比如“噘嘴”“蹚地”“蹚浑水”“蹚水”等原来均含有非规范汉字,含有非规范汉字的词也不能作为推荐词形,但包含的非规范汉字可以作为规范汉字使用后,它们就具有了作为推荐词形的条件。

  [4]《现汉》第7版和第6版对异形词的处理完全一致,因此本文不再对《现汉》第7版进行分析。

  [5]经过《通用规范汉字表》的修订后,一些非推荐词形改为推荐词形,比如“蹚地、蹚水”原为非推荐词形,后成为推荐词形。为避免混淆,在成组引用异形词时,本文依然沿用《一异表》中异形词原有形式,即“趟地—蹚地”“趟水—蹚水”。

  [6]涉及非规范汉字的异形词,必要时会使用括注说明非规范汉字对应的规范汉字。

  [7]LTP官方主页为:http:∥ltp.ai/。分词时,将非推荐词形加入自定义词表,同时先将超长文本切分为短文本再进行分词处理。使用的LTP版本为3.4.0 版。

  [8]“仿佛”“侥幸”“局促”各有2个非推荐词形,“红菓儿”的词频为儿化和不儿化时的词频之和。

  [9]倍比为两个词的频次比值,计算方法参见饶高琦(2016)论文,本文计算时采用了加一平滑。倍比值大于1,说明分子词使用更占优势,值越大,优势越明显。倍比值小于1,说明分子词使用更占劣势,值越接近0,劣势越明显。倍比值等于1,说明分子词和分母词频次相等。

  [10]图中年份选择以2002年《一异表》的试行时间为界,向后17年至2019年,向前22年至1980年。为反映数据更长时间的变化,向前比向后多了5年。

  [11]“昆仑—崑崙()”“渺茫—淼茫”“轻扬—轻颺(飏)”三组异形词的处理结果也是国家规范保持不变,语文辞书向国家规范靠拢。

  [12]“趟”和“蹚”在《现汉》第5版和第6版中的释义有所区别,具体如下:

  趟1 tānɡ 同“蹚1”。(《现汉》第5版)

  趟 tāng 旧同“蹚”。(《现汉》第6版)

  蹚1) tānɡ 从浅水里走过去:~水过河。(《现汉》第5版)

  蹚(*) tāng ① 从浅水里走过去,也指从雪地、草地等走过去:~水过河。② 用犁把土翻开,除去杂草并给苗培土:~地。(《现汉》第6版)

  参考文献:

  1. 白云. 两种版本《现代汉语词典》对异形词整理之比较研究——兼及对异形词规范问题的一些思考.内蒙古大学学报,2007(3).

  2. 国家语言文字工作委员会汉字处编.现代汉语常用字表. 北京:语文出版社,1988.

  3. 江蓝生. 《现代汉语词典》第6版概述.辞书研究,2013(2).

  4. 饶高琦. 基于计算方法的语言规范效力检测初探——以异形词整理工作为例.语言战略研究,2016(6).

  5. 苏新春. 再论异形词规范的俗成性原则——谈异形词规范中的三个问题.语言文字应用,2002(2).

  6. 王宁. 《通用规范汉字表》解读.北京:商务印书馆,2013.

  7. 王宁. 《通用规范汉字表》与辞书编纂.辞书研究,2014(3).

  8. 温红彦. 异形词九问.《人民日报》,2002.01.20.

  9. 许慎(汉). 说文解字.北京:中华书局,2013.

  10. 异形词研究课题组编.第一批异形词整理表说明. 北京:语文出版社,2002.

  11. 张书岩. 从《现汉》对异体字的处理看它的规范观.语言文字应用,2006(1).

  12. 赵翠阳. 异形词社会使用调查与研究——以《现代汉语词典》五、六两版整理规范为例.语言文字应用,2017(3).

  13. 中国社会科学院语言研究所词典编辑室编. 现代汉语词典(第5、6、7版). 北京:商务印书馆,2005,2012,2016.

  14. 中国文字改革委员会编.简化字总表. 文字改革出版社,1964.

  15. 中华人民共和国教育部,国家语言文字工作委员会. 第一批异形词整理表. 北京:语文出版社,2002.

  16. 中华人民共和国教育部,国家语言文字工作委员会. 通用规范汉字表. 北京:语文出版社,2013.

  17. 中华人民共和国文化部,中国文字改革委员会. 第一批异体字整理表. 北京:人民教育出版社, 1956.

  本文系国家社科基金项目“基于《现代汉语词典》的词汇计量研究”(项目编号20BYY170)阶段性成果。

原文刊于《辞书研究》2020年第6期