社科网首页|论坛|人文社区|客户端|官方微博|报刊投稿|邮箱 中国社会科学网

您现在的位置:今日语言学 → 本所概况 → 机构设置 → 应用语言学研究室

应用语言学研究室

作者:应用语言学研究室  来源:语言所  时间:2017-03-23

  语言研究所应用语言学研究室的前身是五十年代到六十年代前期的语言研究所第三组,这个研究组的主要研究领域是实验语音学和机器翻译,组长曾由当时的副所长石明远兼任,副组长刘涌泉负责机器翻译小组的工作。

  中国是世界上很早开始机器翻译研究的国家之一。1956年,机器翻译就被列入了中国国家科学工作的发展规划,课题名称为“机器翻译、自然语言翻译规则的建立和自然语言的数学理论”。在这个国家规划之下,语言研究所从1957年开始了机器翻译研究,作为主持单位与中国科学院计算技术研究所等单位合作,于1959年成功地进行了俄汉机器翻译系统的实验,这是当时世界上为数不多的几个机器翻译系统之一。随后出版了我国第一本机器翻译学术著作——《机器翻译浅说》(刘涌泉、高祖舜、刘倬,科学普及出版社,1964),论述汉-外机器翻译系统的研制方法。这个阶段后来被学界公认为我国机器翻译研究的开创期。


我国第一本机器翻译学术著作《机器翻译浅说》,刘涌泉、高祖舜、刘倬,科学普及出版社,1964年

  经过“文革”十年的停滞,语言研究所的业务工作从1975年开始恢复。1977年应用语言学研究室成立,刘涌泉任室主任,刘倬、廖秋忠先后担任副主任。1985年改组为计算机室和应用语言学研究室,担任室主任和副主任的先后有刘涌泉、刘倬、廖秋忠、姚兆炜、林联合、傅爱平。1995年以后,由于工作的需要,两个研究室再度合并为应用语言学研究室,傅爱平任室主任。七十年代以后至2014年,应用语言学研究室的研究重点是机器翻译和自然语言信息处理。2014年底,顾曰国任室主任,研究重点是多语种多模态语言资源库的建设和辞书编纂系统的研发。


JFY-3(又称科译一号)英汉机器翻译系统于1989年获得国家科技进步二等奖,同时获中国人民解放军科技进步二等奖

  在机器翻译研究方面,七十年代以后,应用语言学研究室先后主持研究和设计了俄-汉、英-汉、法-汉、德-汉等多种语言的实验型和应用型机器翻译系统。比较有影响的系统有:ECMT-78英汉机器翻译系统、JFY系列英汉机器翻译系统和GRA篇名英汉机器翻译系统。其中JFY-3(又称科译一号)英汉机器翻译系统于1989年获得国家科技进步二等奖,同时获中国人民解放军科技进步二等奖;JFY-5(又称GAOLI)英汉机器翻译系统于1993年获得北京市科技进步三等奖;GRA篇名英汉机器翻译系统于1994年获得国防科工委科技进步二等奖;机器翻译系统的语言知识库管理软件于1992年获得首届中国社会科学院青年优秀成果二等奖。机器翻译的研究是理论方法和工程技术并举的。语言所的机器翻译研究始终注重国内外的语言理论,注重语言工程实践,结合汉语的特点,提出了多种语言分析和生成的方法。譬如:融合结构层次、结构功能和原语译语对比差异的中介成分分析法,以谓语为轴心、语法和语义同步分析的句素分析法,个性规则与共性规则相结合的语言分析生成策略,转换、递归、回溯、超前、动态上下文等语句分析算法,开放式系统的设计方法,机器翻译系统语言知识库的建立和应用,等等。这些方法对我国基于规则的机器翻译研究和开发起到了奠基的作用,在相应的历史时期代表了国内的主流研究方向。


GRA篇名英汉机器翻译系统于1994年获得国防科工委科技进步二等奖


JFY-5(又称GAOLI)英汉机器翻译系统于1993年获得北京市科技进步三等奖

  应用语言学研究室的工作还涉及计算语言学和应用语言学的多个领域,包括:中文信息处理、汉语字/词的统计和计量分析、计算词汇学、计算机辅助辞书编纂、语言数据建模、语言规划、术语研究等。近年来,应用语言学研究室的工作主要是语言信息处理的专题研究和应用系统的研制,以及语言数据资源的开发和应用。一方面从工程化角度研究自然语言处理的应用系统,包括语言模型在算法上的形式化,也包括算法的实现、系统的研制和程序设计;另一方面建立学术研究和实际应用中需要的语言数据资源,研究组织和使用这些语言数据的方法和技术,如各种语料库、语言知识数据库、机器词典等,完成了社科院重大课题“基于自然语言数据处理的汉语辞书编纂系统”。此外,在语言研究手段自动化的进程中承担了语言所的信息化建设,以及管理信息系统的研制和维护等工作。


研究室编辑出版的计算语言学学术刊物《语言和计算机》1-3辑(中国社会科学出版社,1982—1986)


七十年代末国家标准《信息交换用汉字编码字符集(基本集)》于1985年获得国家标准局和电子工业部的国家标准二等奖暨电子工业部优秀科技成果奖


机器翻译系统的语言知识库管理软件于1992年获得首届中国社会科学院青年优秀成果二等奖


前排左起:傅爱平、范宇思、李芸、张弘;后排左起:吴杰、吴亮、林联合(和外孙女)、刘倬、王广义、刘倬夫人、王广义夫人,摄于2008年

  在多年机器翻译、语言信息处理研究和语言工程实践的基础上,应用语言学研究室编辑出版了计算语言学学术刊物《语言和计算机》1-3辑(中国社会科学出版社,1982—1986);参加了七十年代末国家标准《信息交换用汉字编码字符集(基本集)》的研制,该项目于1985年获得国家标准局和电子工业部的国家标准二等奖暨电子工业部优秀科技成果奖;参与了八十年代国家首次大规模汉语字词的统计和分析,统计结果编成《现代汉语频率词典》(北京语言学院出版社,1986)、《常用字和常用词》(北京语言学院出版社,1985)和《汉语词汇的统计与分析》(外语教学与研究出版社,1985),其中后者获得1985年北京市社会科学和政策研究优秀成果一等奖;在计算机数据处理的基础上出版了《儿女英雄传虚词例汇》(语文出版社,1994)和《写作措辞参考词典》(中央编译出版社,1995)。除此之外,还出版和发表了有关应用语言学和计算语言学的多部专著、论文和工具书,建立了多个面向语言研究和应用目标的计算机信息系统,譬如:《机器翻译浅说》(科学普及出版社,1964);《中国的机器翻译》(知识出版社,1984);《语言学现代化和计算机》(武汉大学出版社,1986);《应用语言学》(上海外语教育出版社,1989);《多语对照语言学词汇》(北京语言学院出版社,1988);《汉语字母词词典》(外语教育与研究出版社,2009);汉语词汇资料数据库;汉语语句自动分析实验系统;《现代汉语词典》系列数据库系统;汉语辞书XML数据库系统;基于自然语言数据处理的汉语辞书编纂系统。


左起:范宇思、张永伟、张弘、顾曰国、吴杰、李芸、胡钦谙,摄于2017年

友情链接

COPYRIGHT © 2017

中国社会科学院语言研究所版权所有

京ICP备17005063号-1

邮编:100732

地址:北京市东城区建国门内大街5号

电话:010-85195379

Mail:lingcass@yeah.net