2.2.1 从单语言预训练模型到多模态预训练模型