深度强化学习理论与实践
上QQ阅读APP看书,第一时间看更新

1.2 强化学习的模型

强化学习过程包括环境、智能体、策略等基本组成部分,为了从数学上描述强化学习过程,需要对强化学习过程进行数学建模。本节首先介绍强化学习的基本模型、要素及执行过程,再进一步介绍强化学习的数学模型——马尔可夫决策过程,最后介绍几个强化学习模型案例。