在把模型投入生产之前,往往需要评估模型的性能。用于超参调优的工具也可以进行模型验证的交叉验证。当你更新现有的模型时,可以在模型推理中使用A/B测试和多臂老虎机(multi-armed bandit)等技术在线验证模型。