更新时间:2020-04-14 14:52:47
封面
版权信息
前言
第1章 用户画像基础
1.1 用户画像是什么
1.1.1 画像简介
1.1.2 标签类型
1.2 数据架构
1.3 主要覆盖模块
1.4 开发阶段流程
1.4.1 开发上线流程
1.4.2 各阶段关键产出
1.5 画像应用的落地
1.6 某用户画像案例
1.6.1 案例背景介绍
1.6.2 相关元数据
1.6.3 画像表结构设计
1.7 定性类画像
1.8 本章小结
第2章 数据指标体系
2.1 用户属性维度
2.1.1 常见用户属性
2.1.2 用户性别
2.2 用户行为维度
2.3 用户消费维度
2.4 风险控制维度
2.5 社交属性维度
2.6 其他常见标签划分方式
2.7 标签命名方式
2.8 本章小结
第3章 标签数据存储
3.1 Hive存储
3.1.1 Hive数据仓库
3.1.2 分区存储
3.1.3 标签汇聚
3.1.4 ID-MAP
3.2 MySQL存储
3.2.1 元数据管理
3.2.2 监控预警数据
3.2.3 结果集存储
3.3 HBase存储
3.3.1 HBase简介
3.3.2 应用场景
3.3.3 工程化案例
3.4 Elasticsearch存储
3.4.1 Elasticsearch简介
3.4.2 应用场景
3.4.3 工程化案例
3.5 本章小结
第4章 标签数据开发
4.1 统计类标签开发
4.1.1 近30日购买行为标签案例
4.1.2 最近来访标签案例
4.2 规则类标签开发
4.2.1 用户价值类标签案例
4.2.2 用户活跃度标签案例
4.3 挖掘类标签开发
4.3.1 案例背景
4.3.2 特征选取及开发
4.3.3 文本分词处理
4.3.4 数据结构处理
4.3.5 文本TF-IDF权重
4.3.6 朴素贝叶斯分类
4.4 流式计算标签开发
4.4.1 流式标签建模框架
4.4.2 Kafka简介
4.4.3 Spark Streaming集成Kafka
4.4.4 标签开发及工程化
4.5 用户特征库开发
4.5.1 特征库规划
4.5.2 数据开发
4.5.3 其他特征库规划
4.6 标签权重计算
4.6.1 TF-IDF词空间向量
4.6.2 时间衰减系数
4.6.3 标签权重配置
4.7 标签相似度计算
4.7.1 案例场景
4.7.2 数据开发
4.8 组合标签计算
4.8.1 应用场景
4.8.2 数据计算
4.9 数据服务层开发
4.9.1 推送至营销系统
4.9.2 接口调用服务
4.10 GraphX图计算用户
4.10.1 图计算理论及应用场景
4.10.2 数据开发案例
4.11 本章小结
第5章 开发性能调优
5.1 数据倾斜调优
5.2 合并小文件
5.3 缓存中间数据
5.4 开发中间表
5.5 本章小结
第6章 作业流程调度
6.1 crontab命令调度
6.2 Airflow工作平台
6.2.1 基础概念
6.2.2 Airflow服务构成