任务1.2 使用pip和PyCharm完成Python库的管理
微课4
python如何处理大数据
本任务的主要内容:
●使用pip命令管理Python库;
●使用PyCharm平台管理Python库。
1.2.1 了解Python常用库
Python本身的数据分析功能并不强大,需要安装一些第三方的扩展库来增强它的功能。随着Python语言的不断发展,目前Python支持的第三方库越来越多,本节将要重点介绍以下几个库:
●numpy;
●pandas;
●scikit-learn;
●matplotlib.
numpy是Python的一种开源的数值计算扩展,这种工具可用来存储和处理大型矩阵。
pandas是Python的一个数据分析包,该工具是为解决数据分析任务而创建的。pandas纳入了大量的库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
sklearn是scikit-learn的缩写,是针对Python编程语言的免费机器学习库。它提供了分类、回归和聚类算法,包括支持向量机、随机森林、梯度提升、k均值等算法。
matplotlib是一个Python的二维绘图库,它有一个模块,叫作pyplot;pyplot是一个命令型函数集合,它的函数可以创建画布,并且能在画布中绘制图表。
下面,我们重点介绍如何安装这些库。
1.2.2 使用pip命令安装、卸载Python库
pip是Python库管理工具,该工具提供了对Python库进行查找、下载、安装、卸载的功能。
常用的pip命令如下。
(1)显示pip版本的命令:pip--version。
(2)显示pip帮助信息的命令:pip--help/pip-help。
(3)显示当前系统已安装第三方库的列表的命令:pip list。
(4)安装某个第三方库的命令:pip install somepackage(somepackage就是要安装的库的名字)。
(5)卸载某个库的命令:pip uninstall somepackage。
下面,我们介绍如何在命令提示符窗口中执行这些命令。
(1)打开命令提示符窗口。
(2)输入pip--version命令并按【Enter】键,能看到计算机上面的pip当前的版本号,如图1-5所示。
(3)输入pip-help命令并按【Enter】键,我们能看到pip的帮助信息,例如pip的一些命令,如图1-6所示。
图1-5 pip当前的版本号
(4)如果想要看看系统目前已经安装了哪些第三方库,可以使用pip list命令,这样就能看到当前已经安装的库,如图1-7所示。
图1-6 pip的帮助信息
图1-7 当前已经安装的库
(5)如果要安装一个第三方库,例如numpy,可以使用pip install numpy,如图1-8所示。在安装过程中需要保持我们的计算机处于联网状态,这个过程需要花费一些时间。
(6)如果我们要卸载一个第三方库,则需要使用卸载命令,还是以numpy为例,使用pip uninstall numpy命令,如图1-9所示,就能成功卸载这个库。再次使用pip list命令,就看不到numpy这个库了。
图1-8 安装numpy库
图1-9 卸载numpy库
1.2.3 使用PyCharm平台安装、卸载Python库
除了pip命令,还有一种比较简单的方法,就是直接在PyCharm平台上进行库的安装。下面,我们来看一下具体操作方法。
(1)单击PyCharm平台的【File】,选择【Settings…】,如图1-10所示,这样,我们就打开了【Settings】对话框。
(2)在这个对话框的左边列表中选择【Project Interpreter】选项,我们可以看到当前正在使用的是Python 3.6的解释器,在下面的第三方库列表中,我们可以看到这个解释器中已经安装的第三方库,如图1-11所示。
图1-10 【Settings…】
图1-11 【Settings】对话框
(3)如果要安装一个第三方库,需要单击列表右侧的加号按钮【+】,如图1-12所示。
(4)弹出【Available Packages】对话框,我们以matplotlib为例,在搜索框里面输入“matplotlib”,下面的列表就会把名字中含有“matplotlib”的库都筛选出来,这个列表显示的就是当前可以选择安装的库,我们选择要安装的库,然后单击【Install Package】按钮,如图1-13所示。接下来它就会自动安装,这个过程中要保持计算机处于联网状态,当窗体下方出现安装成功的提示信息后,表示安装成功了,这时在第三方库列表中就能看到matplotlib这个库了。
图1-12 加号按钮
图1-13 【Available Package】对话框
(5)如果我们要卸载matplotlib,在第三方库列表中选择【matplotlib】这一项,单击右边的【-】减号按钮,如图1-14所示。这样就能卸载这个被选择的库,当卸载成功的提示信息出现后,即表示卸载成功了,我们再来看一下第三方库列表,的确是看不到matplotlib这个库了。
图1-14 减号按钮
【课堂实践】
请分别使用以上两种方法查看自己的计算机上已经安装了哪些第三方库,在自己的计算机上安装numpy、pandas、scikit-learn和matplotlib这4个第三方库。
职业技能的相关要求
完成任务1.2的学习将达到数据应用开发与服务(Python)(初级)职业技能的相关要求,具体内容如下:
✧数据应用开发与服务(Python)(初级)职业技能的相关要求
■能够使用pip完成Python包的安装、卸载、升级、查询操作。