上QQ阅读APP看书,第一时间看更新
内容提要
在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制方法日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次,基于迭代历史信息,提出一种收敛速度可调节的新颖值迭代算法,有助于加快学习速度、减少计算代价,更高效地获得非线性系统的最优控制律。最后,结合人工智能技术,对无模型值迭代评判学习控制的发展前景也进行了讨论。
本书内容丰富、结构清晰,相关介绍由浅入深、分析透彻,既可作为智能控制、强化学习、优化控制、计算智能、自适应与学习系统等领域研究人员和学生的参考书,又可供相关领域的技术人员使用。