社科网首页|论坛|人文社区|客户端|官方微博|报刊投稿|邮箱 中国社会科学网

您现在的位置:今日语言学 → 学术资讯 → 学术动态 → 青年学术演讲

2018年语言所“五四”青年学术演讲会综述

作者:信息化室  来源:今日语言学  时间:2018-05-23

  编者按:语言所历来重视青年人才培养工作,每年五月举行青年学者演讲会。2018年5月17日上午在所大会议室举办了今年的“五四”青年学术演讲会,共有六位青年学者发表了主题演讲,语言研究所科研人员和学生等共60多人参加了演讲会。刘丹青所长主持演讲会。

  历史语言学研究一室博士后游帅:对汉语侗台语若干关系词的考察

 

  作为语言之间借用关系的主要形式之一,语词的借用是零散的、非体系性的,基本不会发生以词族为单位的借用。通过考察目标关系词在相应语言内部是否存在有规律分布的同源序列,可以初步判断该词的来源,并以此明确汉语侗台语发生接触关系时词语借用的方向。还可借助整齐的同源词序列,明确相应词义,进而考察“关系词”的意义对应是否严格。

  报告从汉语同源词角度对郑伟先生《释古越语“巿”及相关音韵现象——兼论<颜氏家训> “南染吴越”的词汇表现》(《中国语文》2018年第2期)一文中所附举的“凯”“” “”“渹”四组关系词进行了考察。认为它们均属汉语固有词,并不能反映江东方言对山越语的沾染借用,且其中“凯”“”“”三例作为汉语侗台语关系词的可靠性存在欠缺。同时指出,在汉语与侗台语关系词研究中需要注意以下几点:一,注意目标关系词在汉语同源词层面的考察;二,注意目标关系词意义的对应是否准确;三,在语音对比时要适当注意语音的规律对应;四,利用历史方言材料时,不可忽视对其本字的考察。

 

  王志平研究员点评:游帅的演讲表面上是对郑伟文章的商榷,实际上牵扯到汉语与亲属语言比较的一些原则问题。区分同源关系还是接触关系,是同源词还是借词,需要加强汉语与亲属语言两方面的研究。游帅的文章着眼于汉语本体研究,从汉语同族词出发,对于郑伟文中的四组汉语、侗台语关系词做了令人信服的探索,对于亲属语言关系词的借贷方向也做了进一步考察。文章强调亲属语言比较中应注意语音规律的系统对应,避免了亲属语言关系词比较择对的随意性问题。如果能够学习一些侗台语,两条腿走路可能研究效果更好。

  历史语言学研究一室连佳鹏博士:释甲骨文“璞(搏)”字的异体

 

  甲骨文中有一字作(A1)或(A2)形,对于此字应释为何字,前人的意见仁者见仁,莫衷一是。演讲认为此字系“”的简写形式,皆应释为“璞”,象手持“䇂”形工具深入山体内部开采璞玉之形。“A2”所从的“”实际上是由“”形工具演变而来,只不过“A2”省掉了意符“玉”和“甾”。“A1”双手所捧的“王”形是“A2”手中所持之“”中竖向上收缩之后的形体,与“玉”字作,又作;“珏”字作,又作是同样的道理。“A”在甲骨文中用作“攻伐”义,与“”字相同。演讲最后讨论了“璞”读为何字的问题。古音屋部与鱼部可以相通,则古文字中经常和“伐”字连用的“博”“”“”,还有不与“伐”字连用,但也当“击”讲的“”“”等字,应当就是《诗经》中经常和“伐”字连用的“薄”或当“击”讲的“铺”“敷”。这些字很有可能是同一个词的不同写法。不过这些字明显是假借字,并非本字,前辈学者如强运开、高田忠周、容庚、黄盛璋、戴家祥等皆认为“搏”为这些异体的后起字。“搏”亦有“击”义,如《广雅》:“搏,击也”。

 

  王志平研究员点评:连佳鹏的演讲对于甲骨文中的一个疑难字作了新的考释,释该字为“璞”,读为“搏”,解决了甲骨学史上的一件公案,目前看来是一个比较通顺的释读。但是文章字形演变分析仍有缺环,更多的还是靠辞例推勘。至于鱼、屋两部相通的问题,牵扯到跨部的特殊通转,希望补充有关例证,增强文章的说服力。

  《中国语文》编辑部博士后王文颖: 清末民初北京话中副词“所”的性质和功能

 

  文章基于新近整理、影印出版的损公、徐剑胆等人的京味小说代表作品,辅之以清末民初时期的一批日本汉语教材,讨论了清末民初北京话中副词“所”的句法性质和语义语用功能。

  从句法分布来看,“所”不同于一般的程度副词,表现为:a)程度副词经常直接修饰谓词(“很好”),“所”后VP不能是光杆动词或光杆形容词;b)一些不受程度副词修饰的有界成分或终结性成分,前面可以出现“所”(“所吓傻了”“所换下心来了”);c)“所”能够置于时体、能性、语气成分以及焦点成分、连词之前,显示“所”处在较高的句法位置上。文章认为“所”的性质是语气副词。

  “所”在某些句子中还保留一定的概念命题意义,对句子真值有贡献,但即便在这类句子中,“所”也体现出言者的语气或评价。文章论证了“所”的主要功能是表达言者立场。具体又分三种情况:a)用于直接给出评价;b)用于表达言者情感态度;c)用于帮助言者建立受述者视角。在a、b两类情况下,“所”后VP的语义色彩不受限制,c类情况下“所”后VP倾向使用非褒义或不如意的成分,因为不如意的事情更容易让言者“计较得失”,从而实现语用移情。

 

  赵长才研究员点评:清末民初北京话中这类特殊副词“所”,从威妥玛(1883)到周定一(1979),再到陈晓(2013)、魏兆惠(2014)等的研究,跨越三个世纪,对其用法和性质的讨论越来越深入。王文颖的文章在前人研究的基础上从功能表达这一新的视角切入,对“所”做了全面细致的考察,认为“所”具有元话语的功能,可以表达言者的主观立场和态度。为此她从“所”的句法位置、“所”呈现蒙受者视角,以及“所VP啦”“所VP了”的差异等方面做了翔实的论证,得出了自己的创新观点,颇具新意,将这个问题的研究向前推进了一步,对我们了解现代汉语早期阶段的面貌有重要价值,很有意义,值得肯定。

  文章因为主要着眼于描写清末民初这一特定共时层面的特定语言现象,因此对这一类特殊“所”的历史来源的考察自然不是重点。但厘清来源对于探求其语义演变的轨迹是很有必要的,加之作者既然介绍了此前学者关于“所”来源的一些推测和看法,因此我们也就期待作者对这些推测意见做出评估,并对“所”的来源问题也能够提出自己的意见。相信作者今后在这方面会做进一步的拓展研究。

  方言研究室夏俐萍副研究员:湘语显赫标记“咖”“哒”的分途与交汇

  “咖、哒”在湘语中的使用十分普遍,但这两个标记与原型动词在语音、语义上关联模糊,是已经完成语义裂变的两个显赫标记。本研究对湘中、北地区处于同一方言中使用的“咖、哒”、复合形式“咖哒”以及框式结构“咖……哒”进行句法功能和语义分析。得出的结论如下:

  (1)“现实/非现实”情状类型是“咖”“哒”作为动相补语和体标记的分界,非现实情状中,“咖”“哒”具有“失”“得”义的对立,只能充当动相补语。例如:“拿咖箇本书|拿哒箇本书”有“失”义和“得”义的对立。

  (2)在现实情状中,“咖”“哒”的“失”“得”义对立消失,发展为体标记。其中“咖”要求与有界事件搭配,是表示事件得到整体完成的完整体标记。“哒”不敏感于事件是否有界,主要表示动作是否得到实现的实现体标记。“咖”在完整体标记的基础上扩展出表偏离义和近过去时的用法;“哒”在实现体标记的基础上扩展出持续义、偏离义以及方所标记的用法。

  (3)复合形式“咖哒”不是单用形式“咖”“哒”的线性组合,不能用于非现实情状类型。“咖哒”具有现时相关性,这是与单用形式“咖”“哒”的不同之处,具备典型的完成体标记的功能。框式结构“咖……哒”则主要表示对有界事件的信息确认。

  (4)湘语完整体标记、实现体标记以及完成体标记的发展路径受到各自扩展源的支配,在具有现时相关性的有界事件上出现三个标记的互换,但仍然体现出独立的核心功能和用法差异。

 

  刘丹青研究员点评:文章把体标记研究中一些比较有用的概念和方法引进到了湘语的研究,初步划出了“咖”“哒”“咖哒”之间用法上的交汇点和分工所在。在现实和非现实的环境,首先把动相补语和体标记划分出来;其次就是关于有界和无界,“咖”对有界无界敏感,“哒”对有界无界不敏感;文章用了一套精确的概念系统,即有界无界、现实非现实,表明“咖”“哒”“咖哒”虽然被称为完成体,其实“咖哒”才是真正的完成体,它的主要依托就是现实相关性。今天的讲座把我们头脑里原本模糊的东西梳理出来了。这说明在方言语法的研究中仅仅依靠朴素的语感和直觉,不借助新的理论方法视角的帮助,对于有些问题的解决是比较困难的。这些经过证实的概念的引入可以比较快地帮助我们解决一些现实问题。

  文章还可进一步改进的地方:第一,今天可能来不及讲的“哒”,有的时候有一种用法是兼体标记和介词用在动词和处所补语之间,这可能不是体标记发展而来的,而是它的词源“着”的早期用法的保留。第二,文章大量采用最小对比,但是有一处不是最小对比,“他并没有吃咖一碗饭,还剩的一半。”与之比较的是:湘语不能说“他并没吃哒饭,还剩的一半。”上面是“一碗饭”,下面是“饭”,这就不是最小对比,就不能用来证明“咖”和“哒”的区别,而应该放在同等条件下,上面有“一碗”,下面也应该有“一碗”,这样才能够更明显地显示是大量的最小对比的情况下,有一些地方还没有完全注意。

  语音研究室罗颖艺博士:当话题结构遇上韵律边界

 

  话题结构的加工近年来越来越受到心理/神经语言学的关注,但它作为语篇中上下文连接的本质还没有得到足够的挖掘。本次报告的研究正是要揭示汉语母语者在听到汉语特色话题结构(即话题与述题成分不存在句法依存关系)时,通达和运用前文背景信息的认知加工过程,以及话题和述题之间的韵律短语边界在这过程中所造成的影响。在实验里,被试先阅读故事,后听到一些话题结构的句子,并判断与故事内容是否一致。话题结构中的话题为地点信息,在故事中可能有详细的细节描述,也可能只是一般提及。行为结果发现,话题信息丰富度以及话题后的韵律短语边界是否出现并不显著影响母语者对话题结构的理解和自然度判断。但脑电结果发现了两者对于这一动态过程的影响。信息丰富的话题使得语义加工负荷增大,在没有话题边界的情况下,这一负荷从话题一直到述题的动词上都能观测到,然而在有话题边界时则在动词出现前消解。我们认为,话题加工包含了背景信息的提取,背景信息越丰富,话题加工负荷越大;话题后边界对这一过程有促进作用,加快背景信息的提取,易化述题信息的推理整合。

  李爱军研究员点评:汉语的特点之一就是话题显著,话题在篇章衔接和意图表达上更为重要。话题结构不仅是汉语语言学关注的热点也是自然语言处理领域的研究热点。罗颖艺的研究运用认知、心理、神经科学等多学科的视角和方法对汉语话题结构进行探索,拓宽了研究的理论框架和应用前景。研究尤其关注了汉语特色型的话题结构,而采用跨学科路径研究汉语特色语法现象是我们实验室的一个重要方向。后续研究可进一步探讨复杂话题成分、话题后韵律边界多样性特征、述题信息的可及程度等因素对理解过程的影响。

 

  应用语言学研究室胡钦谙博士文本基于序列到序列模型的汉语语法改错

  在对外汉语教学中,教师经常需要批改作文。汉语的二语学习者在写作时所犯的语法错误,往往与以汉语为母语的写作者所犯的错误有很多不同。本研究尝试对二语学习者写的汉语作文进行自动批改,指出作文中的缺(字)词、多(字)词、错(字)词以及词序等四种错误。

  针对二语学习者写的汉语作文语料稀少,经过人工批改的语料更加匮乏的情况,我们对二语学习者在汉语写作中常犯的语法错误进行归纳总结,利用半监督学习的方法,对正确的句子进行增、删、替换及调序等操作,生成了大量含有语法错误的伪数据。同时,本研究将改错问题建模为序列到序列问题,以含有语法错误的句子作为输入,以正确的句子作为输出。我们利用伪数据对序列到序列模型进行预训练,并利用Chinese Grammar Error Detection(CGED) 2018提供的人工标注数据对模型进行了微调。在CGED 2018测试集上的实验结果表明,在全部错误类型上,该系统定位错误的精度超过50%;在缺(字)词和错(字)词两种类型的错误上,改错的精度也达到了50%。 

 

  顾曰国研究员(资料照片)点评:“序列到序列模型”是计算语言学里有影响的重要的模型。把这个方法用于中介语语法改错前人做过,有些比较成功的尝试。胡钦谙跟前人不一样的地方是把这个方法跟半监督学习结合用于自动改错。这是非常值得试验的。现在用于机器学习的中介语语料库,人工标注好的,质量高的,而且达到一定的规模,几乎没有。通过程序自动生成一些伪数据,以克服数据稀疏的问题,的确是个办法。这项研究如果深入下去,一方面要构建高质量的人工标注好的中介语语料库(即监督学习语料库),二是通过程序生成的伪数据,要在基于中介语改错实践的基础上做,以减少盲目性。

 

  刘丹青研究员最后发表总结:今天的报告很有新意,选题非常值得称道。游帅的演讲表明历史语言学研究一室开始将目光由纯粹的文献研究拓展到早期跟亲属语言和其他相关语言的接触关系上,但现在的论证还有待进一步加强;连家鹏把甲骨文中的单纯文字研究跟语义和句法的研究结合起来,这是进一步深化古文字研究的健康道路;王文颖把研究范围延伸到必须借助一定的文献资料来研究的早期现代汉语或者晚期近代汉语上,这是最近一二十年来形成的一个热点,她的适时介入是让研究的目光更加朝前推进;夏俐萍是把现代语言学中语义学的一些概念引入到方言语法的深入研究中;罗颖艺把普通语言学理论中的前沿课题跟神经语言学、脑科学等方面的研究结合起来;胡钦谙把对语法本身的研究、第二语言获得的研究等,用新型计算语言学中人工智能的方式来处理,使语言研究适用于现代大数据时代和智能化时代,利用深度学习技术,将产生出更加实在的应用性成果。总的来说,这些研究的选题令人鼓舞,是在我们研究所求实创新的传统上的继续发展。

经过学术委员会评议,本次演讲会获奖名单公示如下:

一等奖:夏俐萍、罗颖艺 

二等奖:游帅、连佳鹏、王文颖、胡钦谙

 

友情链接

COPYRIGHT © 2017

中国社会科学院语言研究所版权所有

京ICP备17005063号-1

邮编:100732

地址:北京市东城区建国门内大街5号

电话:010-85195379

Mail:lingcass@yeah.net