
推荐序一
从2013年起大数据的概念在国内逐步普及,经过短短几年的时间,相关的技术就在各行各业有了深入的使用和发展,并且越来越多的企业开始重视对大数据项目的规划和建设。大数据的项目建设是以IT信息化部门为主导、企业各部门紧密配合、企业高层驱动的一个持续的过程,其中大数据技术的相关人才尤为重要。
2013年,我与几位志同道合的深耕于数据领域的朋友一起成立了天善智能。至今,天善智能已经成为国内最大的大数据、商业智能BI、人工智能AI的垂直社区之一,来自于百度、阿里巴巴、腾讯、微软、IBM、京东等国内一众知名公司的数据专家也积极地活跃在我们的社区。这些专家广泛地参与天善智能各类线上线下有关大数据技术的布道活动,他们用自己专业的知识、精湛的技术分享极大地点燃了广大大数据技术爱好者的热情,共同推动了大数据技术在国内的普及和发展。
在天善智能的成长过程中,我也有幸结识了很多来自各行各业大数据技术圈的朋友,其中就包括本书的两位作者宋立桓和陈建平。宋立桓老师以前在微软工作,由于我以前也是微软技术的程序开发者,包括之后在工作中使用到微软商业智能BI技术,因此让我们有了更多交流的话题。之后,宋老师去腾讯就职,从大数据到云计算,从一个很深的数据底层走向另一个更深的架构底层,这是一个很好的提升和发展。建平来自传统的行业,在传统行业的数据升级打怪过程中不断将数据运用到了一个很高的高度。
在我们和很多技术专家合作各类线上线下沙龙分享的过程中,大家都意识到了一个问题——大数据知识体系过于庞大,零零散散的知识体系终归需要有一个载体,而这个载体既可以是文字的沉淀,也可以是专业课程的沉淀。很惊喜的是这两位志同道合的朋友在精心酝酿了很长一段时间之后,终于开始行动并将过往经验一一成文。
Hadoop走过这么多年,整个生态体系越来越庞大,作为Hadoop最有影响力的数据管理软件服务提供商之一的Cloudera无疑是一颗耀眼的明星。两位作者从这个切入点开始循序渐进地将Hadoop生态系统中核心的技术、框架、应用一一展开,构成一个完整的知识体系框架,不多不少入门正好。本书案例简洁清晰,不少料不拖沓,可以帮助大家快速学习掌握大数据相关的核心知识点,希望此书能够成为广大大数据技术学习爱好者的手边参考书。
最后,回归到整个大行业,我们仍然要意识到:许多传统企业在从业务信息化到数据信息化的过程并不会一帆风顺。一方面来自于传统业务与大数据结合的场景目前依旧需要实践的检验,存在一个比较长的建设和提炼周期,需要企业在人力、物力、财力有持续的投入和保障。另一方面,每个企业的IT基础、数据基础、技术积累程度不同,对于选择适合自身的大数据方案也并不是那么容易。对于技术人员来说,有些问题我们可能无力解决,我们能够做到的就是不断地夯实大数据技术、用技术驱动传统业务、挖掘业务增长点,让大数据真正地为企业创造业务价值。
天善智能创始人 梁勇