Python爬虫、数据分析与可视化:工具详解与案例实战
上QQ阅读APP看书,第一时间看更新

前言

如果你想快速地掌握Python数据分析和可视化方面的相关技术,以满足一般公司的开发需求,那么本书是很好的选择。本书根据大多数软件公司对Python数据分析和可视化的需求,面向Python初学者讲述爬虫、数据分析、数据可视化和机器学习等方面的技术和实践案例。

从内容体系上看,本书涵盖了Python数据分析和可视化的相关技术,包括Python语法、Python爬虫技术、基于NumPy和Pandas的大数据分析技术、基于Matplotlib的可视化技术和基于sklearn的机器学习技术等。

在讲解技术的同时给出丰富的案例,包括基于唐奇安通道、布林带通道和鳄鱼组线的股票分析案例,用Scrapy框架爬取二手房数据并进行可视化分析的案例,以及基于机器学习的手写体数字识别案例等,这些案例能有效地提高读者的学习兴趣。在这些案例中,不是割裂地讲解各个技能点,而是综合性地讲述爬虫、数据分析、数据可视化和机器学习等技术,从而让读者融会贯通地掌握Python数据分析和可视化的相关技能。

本书内容

本书共分13章,下面进行简要的说明。

第1~4章为基础篇。第1章讲述Python编程的基础知识;第2章讲述Python数据结构的相关知识点;第3章讲述基于Python的面向对象编程思想,包括封装、继承和多态的语法要点;第4章讲述Python异常处理机制和读写文件的技巧,并且在读写文件的案例中引入了异常处理机制的实践要点。

第5~7章为数据分析的工具篇。第5章讲述NumPy库的实践要点;第6章讲述Pandas库的用法;第7章讲述用Matplotlib库绘制可视化界面的技巧。这三个库被称为“数据分析三剑客”,学习这三章的内容能为进一步学习数据分析的案例打下扎实的基础。

第8、9章为数据分析高级技能篇。在第8章中,通过爬取技术博客的案例讲述基于Scrapy爬虫框架的实用技巧,读者不仅能了解通过Scrapy框架搭建爬虫项目的一般方法,还能掌握分析网页制定爬取规则的实用技巧;第9章讲述数据分析的常用方法,其中不仅讲述Python连接、操作数据库的相关技能,还结合Python语言通过箱状图、热力图、时间序列图和小提琴图等可视化效果讲述基于时间序列、概率分析、推断统计和回归分析等数学分析方法。

第10~13章为综合案例篇。在第10章的图书分析案例和第11章的二手房数据分析案例中,不仅给出用Scrapy爬虫框架爬取相关数据的实现代码,还在此基础上绘制柱状图、饼图和词云等可视化效果图;第12章的股票分析案例偏重于数据分析,根据MACD、CCI、唐奇安通道、布林带通道和鳄鱼组线等股票指标算法,计算并绘制相关指标图;第13章讲述基于sklearn库的机器学习相关实践,其中通过波士顿房价、鸢尾花、酒和手写体识别等案例综合运用线性回归分析、岭回归分析、SVM分类、KNN分类和逻辑回归等机器学习算法。

本书特点

本书编者具有多年大型Python数据分析应用系统的开发经验,还有Python数据分析和机器学习等方面的授课经验,所以不仅了解软件公司对Python程序员的普遍要求,还知道如何快速提升Python初学者的实战技能。本书的措辞和写作风格非常适合初学者:一方面,在讲解知识点时使用初学者易接受的语言;另一方面,讲解中包含大量从实际项目提炼出来的开发经验,能让读者快速掌握数据分析、可视化以及机器学习等方面的开发要点,满足读者的职业需求。

本书源代码、教学视频、PPT课件

为方便读者使用,本书提供了配书源代码、教学视频、PPT课件。本书配套资源可以登录机械工业出版社华章公司的网站(www.hzbook.com)下载,首先搜索到本书,然后在页面上的“资源下载”模块下载即可。如果在下载过程中遇到问题,可发邮件到booksaga@126.com,邮件主题为“Python爬虫、数据分析与可视化:工具详解与案例实战”。

本书在写作过程中,得到了夏非彼老师的大力支持,她提出了很多有益的建议,在此深表谢意。

虽然编者在写这本书的时候处处留意,字字斟酌,但限于水平,疏漏之处在所难免,恳请相关技术专家和读者不吝指正。

编者

2020年9月20日