前言
随着Hadoop越来越受欢迎,其生态系统也充满活力,其中包括了一些广泛使用的工具,如Hive、Spark、Impala和HBase等。本书着重讲解Apache HBase工具,它构建于Hadoop分布式文件系统上,具有可扩展性、容错性、低延时等特征。HBase整合了Hadoop的水平扩展能力和实时数据服务两方面的优势。在规模方面,HBase允许从单个集群中进行每秒数百万次的读写操作,同时仍可保持Hadoop所有应用可用。然而,开始使用HBase是一个艰巨的任务。这正是写作本书的原因。
本书以精练的语言介绍HBase相关知识,让初学者能够快速上手使用HBase,在自己的企业环境中运行HBase,深入了解HBase具体能做什么样的业务,快速使用Java调用HBase解决企业的业务问题。
本书内容
本书共分为11章,主要内容安排如下:
第1章介绍HBase的发展历程以及HBase与关系数据库的区别。
第2章通过单机模式和集群模式搭建HBase环境,让开发人员快速地把HBase运行起来。
第3章学习使用HBase的基本指令,其中包括DDL命令、DML命令、命名空间命令等的操作。
第4章使用Java语言操作HBase,包括创建表结构、修改表数据等。
第5章介绍客户端等高级API操作,包括数据查询、数据扫描、多种过滤器的使用以及过滤器的综合使用等。
第6章通过Java开发实现HBase的数据批量加载,包括编写驱动器、上传数据到HDSF等。
第7章介绍协处理器的分类和使用,包括协处理器的加载、配置文件加载、接口编写等。
第8章介绍Phoenix在HBase中的整合使用,包括Phoenix的下载使用和基本指令操作。
第9章解析HBase架构,包括HBase架构原理、HBase读写操作流程、数据刷新机制等。
第10章介绍性能优化,包括表设计优化、列族数量优化、HBase读写操作优化等。
第11章是HBase数据操作实战,包括创建表、新增表数据、修改和删除表数据、批量操作表数据等。
本书包含实践中的大部分应用场景。对于深入研究过HBase的读者来说,通过阅读本书,他们不仅能快速、高效地解决业务问题,还能从运维的角度来优化他们自己的HBase数据库。此外,本书还提供了与HBase内部工作原理相关的基本信息和必要解释。读者越是了解HBase的工作原理,就越能在工程中权衡各种因素,做出合理的决策。
资源下载
本书配套示例源代码和PPT课件,需要用微信扫描下面的二维码获取。如果在阅读中发现问题或有疑问,请通过发送电子邮件至booksaga@126.com与我们联系,邮件主题请标注为“HBase从入门到实战”。
范例程序
PPT
最后,感谢各位读者选择本书,希望本书能对读者的学习有所助益。虽然我们对书中所述内容都尽力核实并多次进行文字校对,但由于时间紧迫,加之水平有限,书中难免会有疏漏之处。敬请广大读者批评指正。我们会积极采纳读者的意见,争取不断完善本书,以此回报读者对本书的支持。
编者
2023年10月