Python中常会用到一些专门的库,如NumPy、SciPy、Pan das和Matplotlib。数据处理常用到NumPy、SciPy和Pandas,数据分析常用到Pandas和Scikit-Learn,数据可视化常用到Matplotlib,而对大规模数据进行分布式挖掘时则可以使用Pyspark来调用Spark集群的资源。从一定程度上来说,学习Python数据分析主要就是学习使用这些分析库。