更新时间:2021-01-05 18:15:41
封面
版权信息
内容简介
人工智能出版工程 丛书编委会
献辞
推荐序
前言
符号
第1章 简介
1.1 自动语音识别:更好的沟通之桥
1.2 语音识别系统的基本结构
1.3 口语理解与人机对话系统
1.4 全书结构
第I部分 传统声学模型
第2章 混合高斯模型
2.1 随机变量
2.2 高斯分布和混合高斯随机变量
2.3 参数估计
2.4 采用混合高斯分布对语音特征建模
第3章 隐马尔可夫模型及其变体
3.1 介绍
3.2 马尔可夫链
3.3 序列与模型
3.4 期望最大化算法及其在学习HMM参数中的应用
3.5 用于解码HMM状态序列的维特比算法
3.6 隐马尔可夫模型和生成语音识别模型的变体
第II部分 深层神经网络在语音识别中的应用及分析
第4章 全连接深层神经网络
4.1 全连接深层神经网络框架
4.2 使用误差反向传播进行参数训练
4.3 实际应用
第5章 高级模型初始化技术
5.1 受限玻尔兹曼机
5.2 深度置信网络预训练
5.3 降噪自动编码器预训练
5.4 鉴别性预训练
5.5 混合预训练
5.6 采用丢弃法的预训练
第6章 深层神经网络-隐马尔可夫模型混合系统
6.1 DNN-HMM混合系统
6.2 CD-DNN-HMM的关键模块及分析
6.3 基于KL距离的隐马尔可夫模型
第7章 训练加速和解码加速
7.1 训练加速
7.2 解码加速
第8章 深层神经网络中的特征表示学习
8.1 特征和分类器的联合学习
8.2 特征层级
8.3 使用随意输入特征的灵活性
8.4 特征的鲁棒性
8.5 对环境的鲁棒性
8.6 信号严重失真情况下的推广能力
8.7 使用合成数据提升鲁棒性
第9章 深层神经网络和混合高斯模型的融合
9.1 在GMM-HMM系统中使用由DNN衍生的特征
9.2 识别结果融合技术
9.3 帧级别的声学分数融合
9.4 多流语音识别
第10章 VAD和唤醒词识别
10.1 基于信号处理的VAD
10.2 基于DNN的VAD
10.3 唤醒词识别的解码器方案
10.4 只用DNN的唤醒词识别
10.5 可定制的唤醒词识别
10.6 多阶段唤醒词识别
10.7 唤醒词识别的位置
第III部分 先进深度学习模型在语音识别中的应用
第11章 卷积神经网络
11.1 概述
11.2 卷积神经网络的基本架构
11.3 卷积神经网络的训练
11.4 时间延迟神经网络
11.5 时频域上的卷积
11.6 时域上的卷积
11.7 深层卷积神经网络
第12章 循环神经网络及相关模型
12.1 概述
12.2 基本循环神经网络中的状态-空间公式
12.3 沿时反向传播学习算法
12.4 一种用于学习循环神经网络的原始对偶技术
12.5 结合长短时记忆单元的循环神经网络
12.6 高速公路LSTM和网格LSTM
12.7 双向LSTM
12.8 GRU循环神经网络
12.9 循环神经网络的对比分析
12.10 讨论
第13章 基于深度学习的语言模型
13.1 统计语言模型简介
13.2 DNN语言模型
13.3 RNN和LSTM语言模型
13.4 CNN语言模型
13.5 语言模型的建模单元
13.6 双向语言模型
13.7 深度学习语言模型的使用
13.8 语言模型与声学模型的联合优化
第IV部分 高级语音识别方法
第14章 深层神经网络的自适应技术
14.1 深层神经网络中的自适应问题
14.2 线性变换
14.3 保守训练