深度学习与围棋
上QQ阅读APP看书,第一时间看更新

第10章 基于策略梯度的强化学习