5.2 值函数的学习方法