1.3 框架：Chainer和ChainerRL_Python深度强化学习：基于Chainer和OpenAI Gym-QQ阅读武侠男生网

上QQ阅读APP看书，第一时间看更新

1.3　框架：Chainer和ChainerRL

还有一种从零开始编程实现深度学习和深度强化学习的方法，但这是一项很难的工作。因此，很多机构和公司已经发布了深度学习和深度强化学习的框架。本书将使用一个名为Chainer的框架。

Chainer是由日本公司Preferred Networks（PFN）发布的深度学习框架，可与Google（Alphabet）公司的TensorFlow以及Amazon公司发布的MXNet媲美。图1.3中的示例就是使用ChainerRL实现的，ChainerRL是Chainer的深度强化学习版本。

Chainer和ChainerRL非常易于程序代码的编写，其优点在于，如果了解其原理，即使是初学者也可以轻松使用它。并且虽然其易于掌握，但也可以用来训练实体机器人操作中使用到的强化学习模型。

此外，作者认为Chainer在采用新技术和升级方面比其他框架更快。