人工智能重塑世界(第2版)
上QQ阅读APP看书,第一时间看更新

(三)语音识别

语音识别是指把语音转换为文字,并对其进行识别、认知和处理。语音识别的主要应用包括电话外呼、医疗领域听写、语音书写、计算机系统声控和电话客服等。语音识别的技术原理如下:

(1)对声音进行处理,使用移动函数对声音进行分帧;

(2)声音被分帧后,变为很多波形,提取波形的声学体征;

(3)提取声学体征之后,声音就变成了一个矩阵,然后通过音素组合成单词。