2.3 一个描述场景的预训练网络