3.2.1 数据采集:获取大模型所需原始数据