语料库基本情况介绍:
在中国社会科学院语言研究所的大力支持下,来自语言研究所多个研究室的研究人员通力合作,组成由语言研究所刘丹青、夏俐萍研究员为主编,唐正大研究员、周晨磊副研究员为主干成员、张永伟副研究员为技术指导的核心团队,依托中国社会科学院“登峰计划优势学科——语言类型学”和国家社科基金重点项目“汉语方言语法特征语料库”(项目编号:19AYY004),建立了汉语方言语法特征语料库(下简称“语料库”),网址为www.dialectgrammar.com。
项目课题组根据多年语言类型学和方言语法的研究和调查经验,编写了《汉语方言语法调查问卷》(夏俐萍、唐正大主编)。据此问卷,课题组委托各地的方言学者,对母语方言进行深入调查。截止至2023年7月10日,语料库已经录有29个方言点的材料,并会根据条件持续增补方言点。这29个方言点及调查负责人的信息如下:
序号 |
方言 |
调查地点 |
负责人 |
1 |
东安土话 |
湖南省东安县新圩江镇芦江村 |
胡乘玲 |
2 |
盐城江淮官话 |
江苏省盐城市亭湖区步凤镇 |
蔡华祥 |
3 |
涿鹿晋语 |
河北涿鹿县矾山镇山兑村、肖家堡村 |
宗守云 |
4 |
都昌赣语 |
江西省九江市都昌县城白洋路 |
曹琳琳 |
5 |
上海吴语 |
上海市虹口区 |
朱佳蕾 |
6 |
淄川冀鲁官话 |
山东省淄川区岭子镇小口村 |
孙克敏 |
7 |
临汾中原官话 |
临汾市尧都区南街卧牛社区 |
严艳群 |
8 |
绍兴吴语 |
浙江绍兴市柯桥区柯桥街道 |
盛益民 |
9 |
祁门徽语 |
祁门县大坦乡大洪村 |
陈瑶 |
10 |
咸宁赣语 |
湖北省咸宁市咸安区马桥镇王畈村 |
王宏佳 |
11 |
平南粤语 |
广西贵港市平南县官成镇官成社区 |
刘春梅 |
12 |
兰州兰银官话 |
兰州市城关区 |
衣莉 |
13 |
瑞安吴语 |
瑞安市玉海街道 |
吴越 |
14 |
汨罗湘语 |
湖南省汨罗市三江镇智峰村 |
陈山青 |
15 |
深圳占米话 |
广东省深圳市深汕特别合作区鹅埠镇水美村 |
吴芳 |
16 |
临海吴语 |
浙江省临海市古城街道 |
卢笑予 |
17 |
广州粤语 |
广州市荔湾区 |
郑媛 |
18 |
漳州闽语 |
福建省漳州市漳州台商投资区角美镇东山村 |
林颂育 |
19 |
宁德闽语 |
福建省宁德市蕉城区蕉北街道南际社区 |
陈丽冰 |
20 |
沈阳东北官话 |
辽宁省沈阳市于洪区大兴乡 |
王越 |
21 |
青海贵德周屯话 |
青海省海南藏族自治州贵德县周屯村 |
周晨磊 |
22 |
梨树东北官话 |
吉林省四平市梨树县 |
曹凤霞 |
23 |
德阳西南官话 |
德阳市中江县 |
阳蓉 |
24 |
邵阳湘语 |
湖南省邵阳县下花桥镇徐家桥村 |
蒋协众 |
25 |
梅县客家话 |
梅江区西郊街道马石居委 |
侯小英 |
26 |
丽水吴语 |
浙江丽水市莲都区 |
盛益民 |
27 |
吉安赣语 |
江西吉安市青原区富田镇高溪自然村 |
昌梅香 |
28 |
浚县中原官话 |
河南省鹤壁市浚县县城 |
辛永芬 |
29 |
宾阳平话 |
广西壮族自治区南宁市宾阳县新桥镇三才村委会粟村 |
覃东生 |
语料库包括每个方言点的基本信息、音系说明、自然对话语料,以及核心内容:22个语法范畴的711句语法例句在各方言中的自然表达。这22个语法范畴是:构词、构词生动形式、名词复数、重叠、代词、数量名结构、定名结构、状语性成分、趋向动补结构、介词与连词、处置被动致使、双及物结构、连动结构、处所存现领有判断、语序与话题、复杂句与复合句、疑问否定、祈使感叹、时体、情态语气、反身相互、比较比拟。
语料库涉及的方言点囊括了十大方言区及若干归属待定的方言,在一定程度上反映了汉语方言语法的整体样貌。而通过对22个语法范畴的详细考察,研究者也会获得对每个方言点的语法样貌较为全面的认识。此外,语料库丰富的查询模式(见下文)也为方言比较提供了有利条件。
综上,通过充分利用语料库,研究者可以在研究某一方言时,将其置于汉语方言的大背景下;在研究方言中某一语法范畴时,将其置于方言整体语法系统的大背景下。这将有力推进方言语法研究的深度和广度。
语料库的基本操作:
用户在注册并登录后可对语料进行搜索。用户可搜索例句,也可搜索调查点。
例句搜索时,可以在“筛选”“分组”“排序”筛选框内设置多重条件。例如,用户可按照例句,搜索某个待考察例句在各方言的说法,也可按照语法范畴,搜索某个语法范畴,等等。多个筛选条件可以叠加。以搜索“一个人”为例。在筛选条件中,设置“例词句”“包含”“一个人”,且“语法范畴”“包含”“时体”;在“分组”条件中设置“例词句”“升序”,在“排序”条件中设置“例词句”“升序”。搜索的结果如下:
结果包含了含“一个人”的“时体”范畴的各方言的例句,用户可以在当前页面看到“方言说法”“国际音标”等信息,“国际音标”一栏还附有各句的发音。
用户也可按照调查点进行搜索。例如,用户搜索“吴语”,可得如下结果:
结果包含了含有“吴语”的方言点,用户可以根据需要进一步查看详情。