HBase--调优篇 HBase

HBase–调优篇

优化对于HBase是必不可少的,庞大的数据集可能因为某个简单的改动让HBase集群的性能提升数倍。    1. 表的设计 1.1 提前创建多个Region 默认情况下,在创建HBase表的时候会自动创建一个Region分区,当导入数据的时候...
阅读全文
HBase--工作原理篇 HBase

HBase–工作原理篇

HBase作为HDFS之上的分布式数据库,其本身并不负责数据存储,而是以二进制文件的形式将数据保存在HDFS上,了解HBase的架构及工作原理,有助于在实际应用中更好的设计表及存储结构,并且可以通过优化集群提高系统性能。 1. HBase系统架构图  ...
阅读全文
HBase--常用过滤器篇 HBase

HBase–常用过滤器篇

引言:Hbase的查询不能像sql语句那样灵活,对于多数的复杂查询都要借助“过滤器”。HBase过滤器的类型很多,但是可以分为两大类——比较过滤器,专用过滤器。过滤器的作用是在服务端判断数据是否满足条件,然后只将满足条件的数据返回给客户端。   &n...
阅读全文
HBase--常用API操作篇 HBase

HBase–常用API操作篇

【常用到的几个类】 1. org.apache.hadoop.hbase.HBaseConfiguration 每一个hbase client都会使用到的对象,它代表的是HBase配置信息。它有两种构造方式: public HBaseConfiguration...
阅读全文
HBase--常用Shell操作篇 HBase

HBase–常用Shell操作篇

HBase为用户提供了一个Shell终端进行交互操作,通过“help get”命令可以获得帮助信息。 【查询相关】 1. 进入hbase shell console     $HBASE_HOME/bin/hbase shell 2. 查看...
阅读全文
HBase--集群安装篇 HBase

HBase–集群安装篇

HBase基于Hadoop,这里假设你已经安装好Hadoop平台。 1. 下载资源 官网:http://mirrors.cnnic.cn/apache/hbase/stable/     2. 上传、解压、软连 说明:过程可参考《VMwar...
阅读全文
HBase--基础介绍篇 HBase

HBase–基础介绍篇

关于Hbase的基础介绍网上已经一大堆了,随便一搜即可知道它的一些描述“列存储”、“BigTable”之类的,在这里直接总结一些基本特性。 1. 基本特性 (1) Hbase基于HDFS(故Hbase和DFS有关,和Yarn无关,如果单纯的操作Hbase,只启...
阅读全文
VMware虚拟机搭建Hadoop2.7.1分布式集群(3台) Hadoop

VMware虚拟机搭建Hadoop2.7.1分布式集群(3台)

这篇文章主要介绍了在本地虚拟机环境(VMware)中搭建最基础的Hadoop集群的过程,包括准备工作、搭建虚拟机和系统、Hadoop集群安装配置、运行MapReduce实例以及整个过程中可能会碰到的一些问题,比较详细,希望对初学者有帮助。 【架构介绍】 &nb...
阅读全文