上QQ阅读APP看书,第一时间看更新
(二)语音声学参数统一平台建设
我们正在建设的统一平台是构建少数民族语言统一(通用)的自然语言语音处理平台。统一平台将利用现代科技,以数据库(量化和数字化)的形式完整地保存少数民族语言音段和超音段的声学参数。出于对多语种语音系统的全面考虑,选择能有效表征目标语言语音系统各种语音现象的声学特征,把所分析、测量到的数据集合成一个完整的语音声学参数库。在此基础上,研发统一平台。用户利用统一平台可以完成查询检索多语种语音声学参数内所有的信息,可以任意设定查询的组合条件,可以对结果集合按照任意字段排序,可以在结果集合中查询词/音素之间任意切换,可以手动/自动对查询结果集进行选择并把选择的结果输出到EXCEL等。统一平台还有统计、分析和分类等功能。随着容纳更多语言声学参数库,可以根据用户需求,改进界面的友好性和系统的强壮性(鲁棒性Robustness)。图20是目前使用的统一平台界面。
图20 “中国少数民族语言语音声学参数统一平台”界面
图21 语音参数检索条件
基于几种语言语音声学参数库上搭建的统一平台的特点如下。(1)实用性:基本上包含了所有音段的主要声学特征,能够满足所有的参数提取、统计分析和比较研究;(2)稳定性:确保了数据库主要结构的稳定性(参数库的扩充不影响其稳定性),这样才能有利于声学参数的积累;(3)扩充性:确保了数据库的可扩充性,以便满足新参数和结构的微调。该平台能够确保数据库内容的维护,包括增加、删除、修改、查询;确保方便提取所有参数,满足相关研究。