深度强化学习:算法原理与金融实践入门
上QQ阅读APP看书,第一时间看更新

第7章 深度确定性策略梯度方法