登录    关于
马育民老师的博客

马育民的博客

QQ:65242847

hbase 存储机制

存储机制

  1. Table 中的所有行都按照 Rowkey 的字典序排列。

  2. Table 在行的方向上分割为多个 HRegion。

  3. HRegion 按大小分割的(默认 10G),每个表一开始只有一个 HRegion,随着数据不断插入表,HRegion 不断增大,当增大到一个阀值的时候,HRegion 就会等分会两个新的 HRegion。 当表中的行不断增多,就会有越来越多的 HRegion。

  4. HRegion 是 Hbase 中分布式存储和负载均衡的最小单元。最小单元就表示不同的 HRegion 可以分布在不同的 HRegionserver 上。但一个 HRegion 是不会拆分到多个 server 上的。

  5. HRegion 虽然是负载均衡的最小单元,但并不是物理存储的最小单元。事实上,HRegion 由一个或者多个 Store 组成,每个 Store 保存一个 Column Family。每个 Strore 又由一个 MemStore 和 0 至多个 StoreFile 组成

https://blog.csdn.net/f1550804/article/details/88380764

https://zhuanlan.zhihu.com/p/54184168


原文出处:https://malaoshi.top/show_1IX2JHL4hXyq.html