一、xSpeechTools语音工具包,主要功能模块:
1.语音语料库录制工具xRecorder,该工具适用于各类有文本底稿的语音库录制任务,在录音进程中可以动态显示波形和语图,录音结束后可以检测振幅大小并自动保存,从而能在一定程度上提高录音速度和质量。最新版新增了条目拷贝和插入功能,适用于文白异读情况的录音操作。
2.音段自动对齐工具xSegmenter,该工具适用于任意语言或方言的音段自动对齐任务,只要提供该语言或方言的语音材料及其相应的发音文本和电子发音词典即可完成无监督的语音训练和音段自动对齐工作,并生成相应的TextGrid标注文件,从而能够在一定程度上提高语音语料库的建设效率。
3.语音听辨感知工具xPerception,该工具不仅能够记录被试操作的按键名称,还可以记录用户对各个声音文件的操作反应时间,并可以针对条目进行录音,能够基本满足语音感知实验的数据采集要求,既可用于语音感知实验,也可用于语音训练。
4.语音文字转写工具xTranscriber,该工具主要适用于语音语料库建设,旨在解决普通话或英语的篇章语音材料的文本转写和校对问题。一方面通过调用 snack 语音工具包实现声音文件读取、音频录制、语音播放、波形显示、振幅检测以及截取声音片段和声音文件保存等功能,另一方面通过联网调用讯飞语音云的语音听写功能实现语音材料的文本转写,目前可支持普通话和美式英语,无语音时长限制。
5.语音跟读对比工具xReader,该工具主要面向语音教学与训练,支持wav格式的音频文件播放、录制与声学参数对比显示,目前支持三种播放模式:A、仅播放原始语音;B、仅播放用户录制的语音;C、混合播放原始语音和用户录音。可支持字、词、句、篇章等不同材料内容的播放与跟读,并可呈现较为详细的音段和韵律标注信息。还支持同屏显示原始声音和用户录音,以便于观察和对比。
二、汉语方言字音系统实验研究脚本合集,这套工具由一系列Praat脚本程序构成,主要分成字表数据处理和字音数据处理两个模块,具有字音录制、标注、声调音高数据分析、共振峰数据分析、声调曲线图制作、声学元音图制作、字音图谱制作、调值测算、调类测算、古今音对应关系分析、同音字表输出、古音分化与合并系数测算等一系列功能。
三、微信小程序“九州音集”。该工具可基于微信程序在线采集并展示语音数据,具有用户注册、目录和条目管理(新建、修改、删除、移动)、语音录制、语音播放、语图展示、语音地图、数据分享、任务发布等一系列功能。另外还开发了一套与之配套的声音文件批量数据下载工具。