HBase从入门到实战

上QQ阅读APP看书，第一时间看更新

上一章目录下一章

前言

随着Hadoop越来越受欢迎，其生态系统也充满活力，其中包括了一些广泛使用的工具，如Hive、Spark、Impala和HBase等。本书着重讲解Apache HBase工具，它构建于Hadoop分布式文件系统上，具有可扩展性、容错性、低延时等特征。HBase整合了Hadoop的水平扩展能力和实时数据服务两方面的优势。在规模方面，HBase允许从单个集群中进行每秒数百万次的读写操作，同时仍可保持Hadoop所有应用可用。然而，开始使用HBase是一个艰巨的任务。这正是写作本书的原因。

本书以精练的语言介绍HBase相关知识，让初学者能够快速上手使用HBase，在自己的企业环境中运行HBase，深入了解HBase具体能做什么样的业务，快速使用Java调用HBase解决企业的业务问题。

本书内容

本书共分为11章，主要内容安排如下：

第1章介绍HBase的发展历程以及HBase与关系数据库的区别。

第2章通过单机模式和集群模式搭建HBase环境，让开发人员快速地把HBase运行起来。

第3章学习使用HBase的基本指令，其中包括DDL命令、DML命令、命名空间命令等的操作。

第4章使用Java语言操作HBase，包括创建表结构、修改表数据等。

第5章介绍客户端等高级API操作，包括数据查询、数据扫描、多种过滤器的使用以及过滤器的综合使用等。

第6章通过Java开发实现HBase的数据批量加载，包括编写驱动器、上传数据到HDSF等。

第7章介绍协处理器的分类和使用，包括协处理器的加载、配置文件加载、接口编写等。

第8章介绍Phoenix在HBase中的整合使用，包括Phoenix的下载使用和基本指令操作。

第9章解析HBase架构，包括HBase架构原理、HBase读写操作流程、数据刷新机制等。

第10章介绍性能优化，包括表设计优化、列族数量优化、HBase读写操作优化等。

第11章是HBase数据操作实战，包括创建表、新增表数据、修改和删除表数据、批量操作表数据等。

本书包含实践中的大部分应用场景。对于深入研究过HBase的读者来说，通过阅读本书，他们不仅能快速、高效地解决业务问题，还能从运维的角度来优化他们自己的HBase数据库。此外，本书还提供了与HBase内部工作原理相关的基本信息和必要解释。读者越是了解HBase的工作原理，就越能在工程中权衡各种因素，做出合理的决策。

资源下载

本书配套示例源代码和PPT课件，需要用微信扫描下面的二维码获取。如果在阅读中发现问题或有疑问，请通过发送电子邮件至booksaga@126.com与我们联系，邮件主题请标注为“HBase从入门到实战”。

范例程序

PPT

最后，感谢各位读者选择本书，希望本书能对读者的学习有所助益。虽然我们对书中所述内容都尽力核实并多次进行文字校对，但由于时间紧迫，加之水平有限，书中难免会有疏漏之处。敬请广大读者批评指正。我们会积极采纳读者的意见，争取不断完善本书，以此回报读者对本书的支持。

编者

2023年10月

上一章目录下一章