更新时间:2024-12-31 18:45:49
封面
版权页
内容简介
作者简介
前言
第1章 智能决策与复杂系统
1.1 智能决策
1.2 复杂系统
1.3 复杂环境特征
1.4 复杂环境建模
1.5 智能体建模
1.6 智能决策系统建模
1.7 应用实践
第1章习题
第2章 人工智能与机器学习
2.1 人工智能简介
2.2 人工智能前沿
2.3 人工智能简史
2.4 人工智能流派
2.5 人工智能基础
2.6 机器学习分类
2.7 机器学习基础
2.8 应用实践
第2章习题
第3章 深度学习入门
3.1 深度学习简介
3.2 深度神经网络
3.3 深度卷积神经网络
3.4 深度循环神经网络
3.5 深度图神经网络
3.6 深度神经网络训练
3.7 应用实践
第3章习题
第4章 强化学习入门
4.1 强化学习简介
4.2 马尔可夫决策过程
4.3 动态规划方法
4.4 蒙特卡洛方法
4.5 时序差分学习
4.6 策略梯度方法
4.7 应用实践
第4章习题
第5章 深度强化学习Q网络
5.1 深度Q网络
5.2 DQN算法介绍
5.3 DQN算法
5.4 Double DQN
5.5 Dueling DQN
5.6 Distributional DQN
5.7 DQN的其他改进
5.8 应用实践
第5章习题
第6章 深度策略优化方法
6.1 策略梯度方法简介
6.2 随机性策略梯度算法
6.3 随机性策略梯度定理
6.4 策略梯度优化几种实现方法
6.5 深度策略梯度优化算法
6.6 置信阈策略优化算法
6.7 近端策略优化算法
6.8 应用实践
第6章习题
第7章 深度确定性策略梯度方法
7.1 确定性策略梯度方法应用场景
7.2 策略梯度方法比较
7.3 确定性策略函数的深度神经网络表示
7.4 确定性策略梯度定理
7.5 深度确定性策略梯度算法
7.6 孪生延迟确定性策略梯度算法
7.7 应用实践
第7章习题
第8章 Actor-Critic算法
8.1 Actor-Critic简介
8.2 AC算法
8.3 A2C算法
8.4 A3C算法
8.5 SAC算法
8.6 应用实践
第8章习题
第9章 深度强化学习与规划
9.1 学习与规划
9.2 基于模型的深度强化学习
9.3 Dyna框架
9.4 Dyna-Q算法
9.5 Dyna-Q改进
9.6 Dyna-2框架
9.7 应用实践
第9章习题
第10章 深度强化学习展望
10.1 深度强化学习背景
10.2 深度强化学习简史
10.3 深度强化学习分类
10.4 深度强化学习面临的挑战
10.5 深度强化学习前沿
10.6 深度强化学习实践
第10章习题