
上QQ阅读APP看书,第一时间看更新
推荐序三
2011年秋,我在西雅图参加微软的技术大会,在之前的一年,EMC刚刚提出了Big Data和Data Lake的理念,我和同事们疯狂地讨论着这个也许会颠覆软件业的新理念。我们意识到,大量的数据和非结构化的社会网络信息会成为这个全新时代的重要资源高地。我们讨论着2005年诞生的Hadoop,2007年Linus Torvalds于10天之内开发GitHub的传奇,2008年中本聪发表比特币论文,2010年张小龙开发了微信,那是伟大的事件频繁发生的5年。
我与本书作者宋立桓老师是在那时候认识的,我们谈了很多关于未来数据应用的场景,我们一致认为,数据的价值将会在未来10年内超过那些陈旧的系统,会有更新一代的应用基于显而易见、唾手可得的数据而诞生。我们将不再依赖复杂的流程和权限,会让每个社会实体都有自知之明和洞见之能。
从那以后,宋立桓老师一直致力于探索数据的价值,以及如何实现数据的价值,从数据分析到数据业务探索,从数据整合到数据共享,他研究得非常系统和完整。《Cloudera Hadoop大数据平台实战指南》是他继《人人都是数据分析师:微软Power BI实践指南》之后的又一力作,通俗易懂,概念清晰,是对大数据架构和相关大数据系统普及的好教程。在本书中,从大数据概念到原理,从理论到实战,从部署到操作,无一不凝聚着他严谨的学习态度和实践精神,是很好的打开大数据宝藏的一把钥匙,也是近年来在该领域不可多得的学习材料。
希望你们和我一起加入本书的阅览与实战的旅程中。
感谢宋立桓老师的作序邀请,预祝有更多推动大数据行业的真知灼见早日发表。
深圳纳实大数据技术有限公司CEO吕骏