Python深度强化学习:基于Chainer和OpenAI Gym
上QQ阅读APP看书,第一时间看更新

1.5 Chainer的安装

使用的程序 chainerrl_test.py

本书使用Chainer 4.0.0版。由于深度学习领域的飞速发展,旧版本的程序被停用的可能性很小,因此请指定要安装的版本。如此一来,虽然读者使用的版本可能不是最新版本,但在本书的讨论范围内不会出现大问题。如果要使用远超出本书内容范围的最新算法,请安装最新版本。

1. Windows环境

执行以下命令:

021-1

让我们确认一下安装是否成功。直接在Web浏览器的地址中输入以下地址来下载v4.0.0.tar.gz:

https://github.com/chainer/chainer/archive/v4.0.0.tar.gz

由于无法使用标准的Windows解压缩软件打开下载的文件,请安装并使用支持tar.gz格式的解压缩软件,例如Lhaplus[1]和7zip[2]。将解压缩的文件移动到如Documents文件夹下创建的DQN文件夹中。通过执行以下命令来确认安装:

021-2

执行后,输出结果如终端输出1.2[3]所示,这一步需要一些时间。

终端输出1.2 train_mnist.py的执行结果(Windows)

021-3

2. Linux环境

执行以下命令。

022-2

通过执行以下命令来确认安装。这里要注意的一点是需要使用python3命令。

022-3

执行后,如果输出结果如终端输出1.3所示,则表示安装成功。另外,从Downloading开始的行仅在第一次操作中显示。

终端输出1.3 train_mnist.py的执行结果(Linux、Mac、RasPi)

022-4

3. Mac环境

执行以下命令。

023-2

该安装确认步骤与Linux的相同。

4. RasPi环境

RasPi OS的安装和设置请参考附录A.2。若要安装Chainer,请执行以下命令。

023-3

该安装确认步骤与Linux的相同。另外,因为训练需要时间,RasPi的计算速度比PC慢。所以我们不建议将其用于第5章以外的内容。此外,RasPi无法运行第4章末尾所示的物理模拟器。


[1]http://www7a.biglobe.ne.jp/~schezo/

[2]https://sevenzip.osdn.jp/

[3]输出结果可能因环境而异。