Python深度强化学习:基于Chainer和OpenAI Gym
上QQ阅读APP看书,第一时间看更新

1.3 框架:Chainer和ChainerRL

还有一种从零开始编程实现深度学习和深度强化学习的方法,但这是一项很难的工作。因此,很多机构和公司已经发布了深度学习和深度强化学习的框架。本书将使用一个名为Chainer的框架。

Chainer是由日本公司Preferred Networks(PFN)发布的深度学习框架,可与Google(Alphabet)公司的TensorFlow以及Amazon公司发布的MXNet媲美。图1.3中的示例就是使用ChainerRL实现的,ChainerRL是Chainer的深度强化学习版本。

Chainer和ChainerRL非常易于程序代码的编写,其优点在于,如果了解其原理,即使是初学者也可以轻松使用它。并且虽然其易于掌握,但也可以用来训练实体机器人操作中使用到的强化学习模型。

此外,作者认为Chainer在采用新技术和升级方面比其他框架更快。