本章讲解Spark中Broadcast和Accumulator原理和源码。10.1节中讲解Spark中Broadcast原理和源码,Broadcast将数据从一个节点发送到其他节点上,一般用于处理共享配置文件、通用的Dataset、常用的数据结构等;10.2节对Spark中Accumulator原理和源码进行详解。Accumulator是分布式全局只写的数据结构,用于数据的累加。