优化对于HBase是必不可少的,庞大的数据集可能因为某个简单的改动让HBase集群的性能提升数倍。 1. 表的设计 1.1 提前创建多个Region 默认情况下,在创建HBase表的时候会自动创建一个Region分区,当导入数据的时候...
HBase–工作原理篇
HBase作为HDFS之上的分布式数据库,其本身并不负责数据存储,而是以二进制文件的形式将数据保存在HDFS上,了解HBase的架构及工作原理,有助于在实际应用中更好的设计表及存储结构,并且可以通过优化集群提高系统性能。 1. HBase系统架构图  ...
HBase–常用过滤器篇
引言:Hbase的查询不能像sql语句那样灵活,对于多数的复杂查询都要借助“过滤器”。HBase过滤器的类型很多,但是可以分为两大类——比较过滤器,专用过滤器。过滤器的作用是在服务端判断数据是否满足条件,然后只将满足条件的数据返回给客户端。 &n...
HBase–常用API操作篇
【常用到的几个类】 1. org.apache.hadoop.hbase.HBaseConfiguration 每一个hbase client都会使用到的对象,它代表的是HBase配置信息。它有两种构造方式: public HBaseConfiguration...
HBase–常用Shell操作篇
HBase为用户提供了一个Shell终端进行交互操作,通过“help get”命令可以获得帮助信息。 【查询相关】 1. 进入hbase shell console $HBASE_HOME/bin/hbase shell 2. 查看...
HBase–集群安装篇
HBase基于Hadoop,这里假设你已经安装好Hadoop平台。 1. 下载资源 官网:http://mirrors.cnnic.cn/apache/hbase/stable/ 2. 上传、解压、软连 说明:过程可参考《VMwar...
HBase–基础介绍篇
关于Hbase的基础介绍网上已经一大堆了,随便一搜即可知道它的一些描述“列存储”、“BigTable”之类的,在这里直接总结一些基本特性。 1. 基本特性 (1) Hbase基于HDFS(故Hbase和DFS有关,和Yarn无关,如果单纯的操作Hbase,只启...