Python数据分析与数据化运营(第2版)
上QQ阅读APP看书,第一时间看更新

第2章 数据化运营的数据来源

“巧妇难为无米之炊”,对于数据工作者来说数据便是所有工作的基础。企业的数据化运营的数据来源复杂,从数据结构类型看,包括结构化和非结构化数据;从数据来源看,既有导出的数据文件、数据库等常见来源,又有流式数据、API等复杂系统接口和外部资源;从数据格式来看,有普通文本、视频格式、音频格式等。

本章将从数据类型和数据来源两个方面介绍数据化运营的数据来源,在第3部分我们还会简单介绍有关读取非结构化数据集的知识,包括网页抓取数据、文本、图像、视频、语音等,用来进行数据化的整体数据资源的整合。