4.6.1 彩虹算法对DQN的优化