Python 3爬虫、数据清洗与可视化实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

前言

Python是军刀型的开源工具,被广泛应用于Web开发、爬虫、数据清洗、自然语言处理、机器学习和人工智能等方面,而且Python的语法简洁易读,这让许多编程入门者不再望而却步,因此Python在最近几年非常受欢迎,各行各业的技术人员都开始使用Python。

本书内容来自笔者在高校授课的内容,主要介绍如何运用Python工具获取电商平台的页面数据,并对数据进行清洗和存储。本书简化了Python基础部分,保证有足够的篇幅来介绍爬虫和数据清洗的内容。

本书采用的版本是Python 3.6.2,是笔者写书时的最新版本,而且笔者习惯用的操作平台是Windows系统。虽然目前一些高校和开发者在使用Python 2.7,但是Python团队将在2020年停止对Python 2.7的支持更新,Python 2.X转向Python 3.X是大势所趋。

本书第1章简单介绍Python和相关的IDE,如果读者完全没有Python基础,那么建议选购一本基础书作为辅助。第2~6章介绍爬虫的实例,实现从最简单的爬虫到相对比较复杂的爬虫。鉴于实例的限制,本书的爬虫内容没有涉及代理服务器和验证码处理等问题。第7章介绍在Python中如何连接并操作数据库。第8章介绍了NumPy及其用法。第9章详细介绍pandas的功能,pandas是Python数据清洗和建模中非常重要的库。第10章用两个完整案例展示了从爬虫到建模的过程。第11章介绍Python的可视化,选用的库是matplotlib和pyecharts,这里详细介绍了pyecharts。

鉴于作者的水平有限,不足之处请读者不吝指教。

轻松注册成为博文视点社区用户(www.broadview.com.cn),扫码直达本书页面。

下载资源:本书如提供示例代码及资源文件,均可在下载资源处下载。

提交勘误:您对书中内容的修改意见可在提交勘误处提交,若被采纳,将获赠博文视点社区积分(在您购买电子书时,积分可用来抵扣相应金额)。

交流互动:在页面下方读者评论处留下您的疑问或观点,与我们和其他读者一同学习交流。

页面入口:http://www.broadview.com.cn/33359