自己动手做大数据系统(第2版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

前言

写作背景

在第1版的基础上,本书对近几年大数据领域最新出现的各种流行组件,逐个进行介绍,并以离线大数据和流式大数据两个具体示例贯穿本书的第二、三部分内容,对组件之间的协同工作关系进行剖析。这里新增了大数据平台的架构选型及最佳实践案例、大数据治理、流计算开发、基于Docker的大数据运维部署等部分。书中所使用的示例程序,是基于笔者在进行企业培训时,企业提出的业务需求而展开的,从而使得示例程序更有代表性。

本书特色

• 在本书第1版的基础上,按照离线大数据和流式大数据两个场景进行划分,这样更有针对性。

• 在代码实现上由本书第1版的以Java为主变为现在第2版的以Python为主,紧贴主流编程语言。

• 代码的可用性增强。对于本书第1版的爬虫部分代码,随着目标网站的样式变更,书中的那些代码无法继续运行。现在第2版的爬虫目标网站为作者制作的模拟站点,这样就保证了读者运行书中爬虫代码时的持续可用。

• 提供和本书配套的示例程序运行地址。读者可以登录http://www.broadview.com.cn/38202,运行书中所提供的示例程序,并下载书中有关章节的源码。

• 提供和本书配套的大数据组件Docker的文件下载,以便读者可以在本机运行书中所讲解的示例程序。

• 提供QQ读者群(群号:50926571)在线答疑。

读者人群

• Python编程爱好者

• 在校学生

• 想转行从事大数据工作的在职IT人员

参考书籍

1.《Hive编程指南》:[美]卡普廖洛等著,曹坤译,人民邮电出版社2013年出版

2.《HBase权威指南》:[美]乔治著,代志远等译,人民邮电出版社2013年出版

3.《Python编程快速上手—让繁琐工作自动化》:[美]斯维加特著,王海鹏译,人民邮电出版社2016年出版

4.《Python高效开发实战:Django、Tornado、Flask、Twisted》:刘长龙著,电子工业出版社2016年出版

5.《Redis实战》:[美]卡尔森著,黄健宏译,人民邮电出版社2015年出版

6.《Redis入门指南》(第2版):李子骅编著,人民邮电出版社2015年出版

7.《Kafka权威指南》:[美]妮哈·纳克海德等著,薛命灯译,人民邮电出版社2018年出版

8.Learning Apache Flink:Tanmay Deshpande著,Packt Publishing 2017年出版

9.《深度实践Spark机器学习》:吴茂贵等著,机械工业出版社2018年出版

读者服务

扫码回复:38202

img

• 获取博文视点学院20元付费内容抵扣券

• 获取免费增值资源

• 加入读者交流群,与更多读者互动

• 获取精选书单推荐