当心错误的奖励函数