智能控制与强化学习:先进值迭代评判设计
上QQ阅读APP看书,第一时间看更新

6.3 基于新型代价函数的广义值迭代算法